Selección de Lecturas
de Análisis de Datos
en la Cultura Física
Selección a cargo de:
Ramón S. Folgueira Roque
y
Magda Mesa Anoceto
Selección de Lecturas de Análisis de Datos en la Cultura Física
2
Índice
Medición
MSc. Rodrigo P. Manrique de Lara Rosell
Introducción 4
Algunos enfoques del concepto de medición 4
Definición de medición 5
Instrumento de medición 6
Preguntas 7
Escalas de medición
MSc. Ramón S. Folgueira Roque
Introducción 8
Escala nominal 8
Escala ordinal 10
Escala de intervalos 12
Escala de proporción o razón 13
Preguntas 13
Recomendación 14
Medidas de localización
MSc. Ramón S. Folgueira Roque
Media aritmética 15
Mediana 15
Moda 16
Propiedades de la media, la mediana y la moda. 17
Medidas de localización 17
Preguntas 18
Medidas de dispersión y otras medidas
MSc. Ramón S. Folgueira Roque
Medidas de dispersión 19
Recorrido 19
Desviación media 20
Desviación típica 20
Propiedades del recorrido, la desviación media, la desviación típica. 20
Coeficiente de variación 21
Otras medidas 21
Trabajo independiente 22
Pregunta 22
Selección de Lecturas de Análisis de Datos en la Cultura Física
3
Probabilidades
MSc. Reina Acosta Rodríguez, MSc. Vilma Hernández Rey y MSc. Antonio Varona Rojas
Introducción 23
Experimento aleatorio. Espacio muestral. Suceso o evento. 23
Tipos de sucesos 24
Operaciones con sucesos 25
Definición clásica y estadística de probabilidad 26
Sucesos independientes 28
Sucesos mutuamente excluyentes 28
Reglas de probabilidad 29
Variable aleatoria 29
Tipos de variables aleatorias 30
La curva normal 30
Comparación de poblaciones
Dra. C. Magda Mesa Anoceto y MSc. Ángela Díaz de Villegas Reguera
Breve introducción a las pruebas de hipótesis 32
Comparación de dos poblaciones. Pruebas de hipótesis paramétricas y no
paramétricas.
33
Esquema general de comparación de dos poblaciones 33
Test de Student y Fisher para comparar variables independientes con
distribución Normal. Test de Student para comparar variables apareadas.
36
Comparación de varianzas 37
Test de Student para muestras independientes 37
Test de Student para muestras apareadas 38
Alternativas no paramétricas de comparación. Transversal y longitudinal. Los
tests de Mann-Whitney y Wilcoxon.
40
Test de Mann-Whitney o de suma de rangos de Wilcoxon 41
Test de Wilcoxon para muestras apareadas 46
A modo de conclusiones 44
Comparación de más de dos poblaciones. Análisis de varianza unifactorial.
Pruebas de hipótesis paramétricas y no paramétricas.
44
Hipótesis necesarias 45
Algunos ejercicios para la reflexión 48
Medida de relación
MSc. Ramón S. Folgueira Roque
Correlación 51
Diagrama de dispersión 52
Algunos tipos de correlación 53
Prueba de hipótesis para la correlación 56
Entrada de datos y salidas en los software para obtener la correlación 57
Trabajo independiente para el lector 59
Bibliografía 60
Guía para el trabajo de curso de Análisis de Datos 61
Selección de Lecturas de Análisis de Datos en la Cultura Física
4
Medición
MSc. Rodrigo P. Manrique de Lara Rosell
Introducción
Como se sabe las mediciones juegan un papel de extrema importancia para la Cultura
Física, pues ellas son la información de partida en la solución de la mayoría de los
problemas planteados. Pero dado que en la propia Cultura Física se encuentra la
Educación Física, el Deporte, la Recreación y la Rehabilitación, que son de por sí
ramas apartes de desarrollo, se producen una gran diversidad en el tipo de mediciones
que se realizan, existiendo diferentes tendencias en la consideración del concepto de
medición que hacen que sea muy difícil trabajar en investigaciones de carácter
multidisciplinario e incluso en alguna en particular. Estas insuficiencias en el concepto
de medición pueden dar lugar a deficiencias en el trabajo práctico - científico y sobre
todo en el procesamiento y análisis de la información obtenida.
Algunos enfoques en el concepto de medición
Uno de los enfoques que se ha observado en el desarrollo de algunos trabajos es
considerar solamente como medición a aquellas que se encuentren incluidas en un
sistema cuya métrica puede responder a la pregunta:
¿Cuántas veces es más grande una medición que otra?
Con este enfoque algunos autores dicotomizan a los datos y lo que es más importante
al tipo de procesamiento, en cuantitativos, si los datos obedecen a una respuesta
afirmativa de la pregunta anterior y cualitativos si la niegan. Esta partición origina un
enfoque metodológico que no permite la adopción de elementos comunes en ambas
tendencias, lo que no es necesariamente cierto, conduciendo a enfoques
operacionales en el tratamiento de la información casi siempre miope y algunas veces
inefectivo hacia la solución de los objetivos planteados.
Otro enfoque más amplio que el anterior considera como medición a aquellas cuyo
sistema responda como mínimo a un ordenamiento estricto de los resultados. Esta
dirección presenta el inconveniente de no considerar como medición a aquellas que no
cumplan este requisito.
Un enfoque más abarcador es el señalado por Zatsiorski (1989) que considera a la
medición en un sentido más amplio, definiéndola como la correspondencia que se
establece entre los fenómenos estudiados por una parte y su expresión numérica por
otra. Esta definición, representa, a nuestro juicio, un avance respecto a las anteriores,
pero en ella se advierten los siguientes inconvenientes:
1. Posibilita solo establecer la correspondencia con números.
Este aspecto limita considerablemente el trabajo puesto que en muchos casos es
cómodo y conveniente establecer esta correspondencia con letras e incluso
símbolos. Por ejemplo, supongamos que se está trabajando con una base de
datos donde se analizan las provincias de residencia de un grupo de atletas. Si ha
estas solo se las designa mediante números, habría que estar haciendo
referencias (utilizando la memoria o la escritura), con respecto a qué número le
corresponde una determinada provincia.
En realidad, en su aspecto práctico, el enfoque de hacer corresponder a un
número el resultado de una medición obedecía a la limitante establecida por los
primeros software estadísticos, donde muchos de ellos no permitían la utilización
de caracteres alfanuméricos. Sin embargo, en la actualidad, esa limitante no
existe. De ahí que en cualquier paquete estadístico sea posible trabajar, con letras,
con números, con símbolos e incluso con combinaciones de ellos.
Selección de Lecturas de Análisis de Datos en la Cultura Física
5
2. Ofrece una visión falsa a aquellas personas que comienzan con el procesamiento
de bases de datos para operar con estos como si respondieran a mediciones con
una métrica homóloga a las magnitudes físicas.
En efecto, todos sabemos que 1+1=2 y que 7/4= 1.75, pero no necesariamente
estos resultados pueden corresponder al hecho que se está midiendo y los análisis
que se realicen, al no estar sustentadas por la realidad, originan resultados muy
catastróficos.
3. No considera a la medición como un proceso.
En efecto a nuestro juicio la medición es el resultado de un proceso donde en
ocasiones interesa más de qué forma se ha operado el proceso que el propio
resultado del mismo.
4. No establece las condiciones para la correspondencia entre el fenómeno y el
resultado.
Hernández-Sampier (2003) quien hace su propia definición de medición y aunque
en ella no propone las condiciones para la vinculación, más adelante señala que
“...el instrumento de medición o de recolección de datos juega un papel central...
Es por ello que proponemos considerar como definición de medición la siguiente:
Definición de medición
Medición: es cualquier proceso en que mediante un instrumento es asignado un
numeral a un nivel, o a un estado de alguna cualidad de un elemento
de una población objeto de estudio, o a una unidad experimental.
En esta definición se hace necesario distinguir los siguientes aspectos:
Cualidad
En el contexto de la definición entendemos por cualidad a cada una de las
circunstancias o características que distinguen a las personas o a las cosas. Dada
la generalidad del concepto (cualidad), quedan englobadas en la definición
cualquier tipo de característica que se considere objeto de estudio.
Numeral
Entendemos por numeral a cualquier combinación de caracteres alfanuméricos.
Con esto se está logrando que el resultado de la medición no tenga que ser
obligatoriamente expresado mediante un número, sino que pueda ser utilizados,
números, letras, e incluso símbolos, solos o combinados entre sí.
Entonces, con esta definición se logra:
1. Situar al concepto de medición en el lugar que le corresponde.
Esto es mediante un proceso, todo lo general posible, donde pueden admitirse
tanto los resultados de procesos objetivos como subjetivos y en donde su
resultado es la propia medición.
2. Liberar la correspondencia que se establece de las restricciones que surgen de
tener que asociar a medición con un número.
En efecto, el hacer corresponder un numeral a la unidad experimental o elemento
de la población objeto de estudio, le imprime una mayor fuerza tanto en el campo
conceptual como en el metodológico, debido a que:
3. Obliga al especialista a analizar las características, en cuanto al nivel de medición,
que está representando este numeral de acuerdo a la medición planteada.
En efecto, uno de los errores más frecuentes es establecer operaciones,
principalmente promedios, a mediciones que no tienen el nivel necesario para que
este se realice, por el motivo de que al hacerse la correspondencia entre números
Selección de Lecturas de Análisis de Datos en la Cultura Física
6
se piense que son susceptibles de ser planteadas libremente todas las
operaciones que son inherentes a estos.
4. Posibilita el realizar una mejor descripción del objeto de estudio principalmente en
las categorizaciones.
Las ventajas que tiene este aspecto son innegables, dada la comodidad que
permite el trabajo con caracteres alfanuméricos.
A continuación presentamos cinco ejemplos donde se muestra la compatibilidad de la
definición en aspectos que aparentemente son disímiles.
Ejemplo 1: En el resultado del salto de longitud sin carrera de impulso de un estudiante
en un grupo escolar, se estará en presencia de un proceso que compara la
magnitud que se desea medir con otra homogénea que se toma como unidad de
medida, utilizando como instrumento de medición, por ejemplo, una cinta
métrica. Al resultado de este proceso se le ha asignado el numeral, digamos de
1,55; expresada ésta en metros.
Ejemplo 2: Cuando estamos sometiendo a una persona a un cuestionario con el fin de
evaluar alguna característica necesaria al objeto de estudio, vemos que en la
evaluación obtenida ha sido realizado un proceso de medición, mediante el cual
asignamos un numeral de acuerdo a una regla dada por las condiciones
evaluativas del cuestionario y que son inherentes a él. El resultado de este
numeral pudo haber sido: EXCELENTE, BIEN, REGULAR, etc., según sea el
caso.
Ejemplo 3: Un juez está analizando el desempeño táctico de un atleta, al que puede
ubicarlo en una categoría determinada, o asignarle una cierta puntuación, o
establecer un orden de primacía respecto a otros atletas. El resultado que se
observa lo hace corresponder con un numeral que esté en consonancia la
capacidad táctica mostrada por atleta.
Ejemplo 4: A un experto se le solicita que evalúe el contenido metodológico de una
clase de Educación Física observada a un docente, de acuerdo a una guía de
observación. En dependencia de la correspondencia que se establece con los
distintos aspectos, el experto le asigna al docente un numeral (EDUCACIÓN
DEL RITMO, ENSEÑANZA DE LA TECNICA, DESARROLLO DE LA
SALTABILIDAD, DESARROLLO DE LA FLEXIBILIDAD, etc., e inclusive
combinaciones de las anteriores) que esté en correspondencia con la actividad
desarrollada.
Ejemplo 5: En una base de datos se está analizando el sexo de las personas que
conforman la muestra. Para ello una persona, con una metodología determinada,
le asigna un numeral que refleje la cualidad del sujeto.
Instrumento de medición
En los ejemplos anteriores, bastante disímiles, se han presentado resultados de
mediciones. Ahora bien, es de todos conocido que cuando se está realizando una
medición, se hace necesario poder contar con un instrumento de medición.
En efecto, en los ejemplos anteriores ha ocurrido que en el primer ejemplo ha existido
un instrumento de medición, la cinta métrica.
En el segundo ejemplo, está claro que el instrumento de medición es el cuestionario
que recibe el sujeto y mediante el mismo podemos establecer una medición de la
cualidad que estamos analizando.
En el tercer ejemplo, ocurre que el instrumento de medición es el propio juez.
En el cuarto ejemplo el instrumento de medición, en que se apoya el experto para
realizar la medición, recibe el nombre de guía de observación.
Selección de Lecturas de Análisis de Datos en la Cultura Física
7
En el quinto caso el instrumento de medición es el sujeto que está determinando el
sexo de cada uno de los componentes de la muestra.
De los ejemplos anteriores se colige que se hace necesario establecer una definición
de instrumento de medición que sea lo suficientemente general, como para que sean
englobados todos estos aspectos, y que responda al concepto de medición planteado.
Es por tanto que establecemos la siguiente definición.
Instrumento de medición: es todo recurso que nos permita asignar un numeral
a un nivel o estado de una cualidad poseída por un elemento o
unidad experimental de la población objeto de estudio.
Creemos que esta definición es completamente compatible a todas las situaciones
planteadas y en general a todas donde se obtenga una medición, de acuerdo a la
nueva definición de medición aquí ofrecida.
Por último se hace necesario plantear que bajo el concepto establecido de medición y
de instrumento de medición, le son susceptibles a ser aplicados en ellas aspectos
inherentes al concepto tradicional de medición, entre ellos se tienen:
La confiabilidad de la medición.
La validez de la medición.
La calibración de errores.
Ahora bien, aunque en el contexto teórico planteado se han unificado aspectos
disímiles en cuanto a las mediciones, se hace necesario establecer diferencias entre
ellas. Un enfoque correcto en el análisis de estas diferencias deberá ser encauzado en
base a la clasificación de éstas de acuerdo a las escalas de medición de Stevens y a
su carácter continuo o discreto.
Preguntas
1. ¿Por qué resulta importante en las investigaciones, donde intervengan varios
especialistas llegar a un acuerdo sobre el concepto de medición con que se va
a trabajar?
2. ¿Cuáles desventajas tiene el considerar a una medición únicamente cuando se
puede relacionar con ella un número?
3. Analice la definición de medición que aparece en este documento, para ello:
a) Explique con sus propias palabras el significado de numeral. Ponga
algunos ejemplos de numerales asignados a su actividad profesional.
b) Tienen lugar, bajo el concepto de medición establecido, las mediciones
subjetiva. Ponga ejemplos de este tipo de medición.
c) ¿Qué se entiende por instrumento de medición? Cite ejemplos de
instrumentos de medición y mediciones realizadas con los mismos en su
actividad profesional.
Selección de Lecturas de Análisis de Datos en la Cultura Física
8
Escalas de medición
MSc. Ramón S. Folgueira Roque
Introducción
Si se desea conocer cómo se desarrolla el proceso de la actividad física es necesario
hacer mediciones
1
, para ello se le miden a los sujetos involucrados en este proceso,
por ejemplo: el tiempo de la carrera, su talla, la flexibilidad del tronco, el nivel de
conocimientos, la fatiga acumulada por el ejercicio, las dolencias producidas por la
acumulación del entrenamiento y muchas otras medidas diferentes. Estas mediciones
o variables no tienen las mismas características, no están en la misma escala de
medición. Para poder identificar el procedimiento que nos permite interpretar los
resultados de una variable es necesario conocer en qué tipo de escala de medición se
encuentra.
Cuando el resultado de una variable es un número y además este número representa
la cantidad, o potencialidad del sujeto medido, muchas veces manifestada en una
unidad física (por ejemplo: metros, kilogramos, segundos, etc.), la escala tiene
carácter numérico, cuantitativo o métrico. Hay dos tipos de escalas cuantitativas.
En el caso que la variable no tenga carácter numérico, o sea, que de la valoración de
un individuo resulte una palabra, sigla, letra u otro tipo de dato no numérico; o un
número que no represente su cantidad numérica sino solo la categoría o nivel
cualitativamente diferente a otro, la escala tiene carácter cualitativo.
Hay dos tipos de escalas cualitativas, estas se diferencian en que en una de ellas los
resultados se pueden ordenar según un criterio propio de la variable. Este orden
puede ser de mayor a menor, de un nivel o grado más bajo hasta un nivel o grado más
alto. Así por ejemplo, si consideramos la variable grupo de edad y tenemos en cuenta
los posibles resultados: párvulo, niño, adolescente, joven, adulto y anciano; esta
variable tiene un orden que indica que un sujeto ha vivido más que otro. Las escalas
cuantitativas tienen también esta propiedad.
Las escalas cuantitativas o métricas se diferencian en que en una de ellas el cero (0)
indica la ausencia de la propiedad que mide la variable y por tanto los valores
negativos tienen interpretación indicando “falta de” o insuficiencia de la propiedad
medida. Si consideramos el aumento de peso como una variable, el valor de 0
kilogramos indica que no hay aumento de peso y –1,5 kilogramos significa que el
sujeto medido disminuyó (contrario a aumentó) de peso.
Al tener en cuenta el tipo de escala que tiene una variable es necesario considerar
todos los valores posibles de la misma. Existen cuatro tipos de escalas para clasificar
a las variables que son:
ESCALAS
Cualitativas
1. Nominal
2. Ordinal
Cuantitativas o Métricas
3. de intervalos
4. de proporción o razón
Escala nominal
Es la escala más general, puramente cualitativa, se utiliza con valores discretos, en
ella, la variables solamente discriminan entre los sujetos, cada resultado indica la
pertenencia del sujeto a una determinada categoría, no puede haber confusión al
1
El concepto de medición y medir está usado en su sentido más amplio, incluye observación y
encuesta.
Selección de Lecturas de Análisis de Datos en la Cultura Física
9
clasificar a un sujeto, siempre se tendrá un solo valor para identificarlo y los sujetos
con igual resultado pertenecen a la misma categoría. Ejemplos de variables en esta
escala son:
Provincia donde vive
Deporte que practica
Sexo
Posición en el juego
Número de la camiseta
Es común utilizar símbolos, palabras u otro tipo de identificación para representar los
diferentes valores de la variable, pueden usarse los números pero estos no tienen
validez numérica. Los datos no se pueden ordenar en ninguna forma, la relación
mayor – menor entre ellos no existe y tampoco existe el concepto de ausencia de la
propiedad que se está evaluando. Para obtener resúmenes en esta escala se utiliza la
frecuencia o conteo con que aparece cada valor posible, la proporción de los mismos y
el porcentaje. Puede indicarse el valor más frecuente o moda como el que caracteriza
a un grupo de sujetos. Estos métodos de resumir se pueden utilizar en los cuatro tipos
de escalas. Sin embargo, no hay forma de resumir las variaciones, dispersión o
concentración de los datos en esta escala.
En la representación gráfica de los datos de una variable en escala nominal no es
importante el orden. Si se tiene en la tabla 1 los datos obtenidos de la preferencia de
un grupo de niños en una escuela, cualquiera de los gráficos 1 y 2 es bueno para su
interpretación. No obstante puede resultar más demostrativo el gráfico 2, pero la
representación de izquierda a derecha a respondido casualmente a los resultados
observados y no a una propiedad de la variable.
Tabla 1: Porcentaje de Alumnos en la Escuela José
Antonio Echevarria por el Deporte Preferido
DEPORTE PREFERIDO PORCENTAJE
Baloncesto 14%
Taichi 21%
Béisbol 41%
Fútbol 24%
Gráfico 1
: Deporte Preferido
por los Alumnos de la Escuela
José Antonio Echevarria
0%
10%
20%
30%
40%
Baloncesto Taichi Béisbol Fútbol
Selección de Lecturas de Análisis de Datos en la Cultura Física
10
Gráfico 2
: Deporte Preferido
por los Alumnos de la Escuela
José Antonio Echevarria
0%
10%
20%
30%
4
0%
Béisbol Fútbol Taichi Baloncesto
Escala ordinal
Es una escala cualitativa con valores discretos, en ella además de discriminar entre los
sujetos se puede establecer un cierto orden de los mismos, cada resultado indica la
pertenencia del sujeto a una determinada categoría, las cuales están ordenadas, o sea
que se establece un orden entre los resultados a través de la relación mayor – menor
(por ejemplo: mejor que, preferible a, etc.). Los sujetos con igual resultado pertenecen
a la misma categoría o nivel. Estos niveles o categorías no pueden confundirse.
Algunas variables que se encuentran en esta escala son:
Categoría deportiva
Lugar obtenido en la competencia
Evaluación en la prueba (excelente, bien, regular o mal)
No es necesario indicar los posibles valores con un número, pueden usarse símbolos,
palabras u otro tipo de identificación y no existe el concepto de ausencia de la
propiedad que se está evaluando. Para obtener resúmenes en esta escala se pueden
utilizar los mismos que para la escala nominal, pero el valor que mejor caracteriza al
grupo es la mediana, que es el valor que divide a la mitad los datos obtenidos, el grupo
de los valores que son menores que la mediana y el grupo de los valores mayores que
la mediana. Para obtener las variaciones, dispersión o concentración entre los sujetos
en un grupo se obtiene el rango, amplitud o recorrido que es la diferencia entre los
valores máximo y mínimo.
Para este tipo de escala es necesario en la representación gráfica mantener el criterio
de ordenamiento de la variable. Se representan en los gráficos 3 y 4 los datos de las
pruebas funcionales respiratorias de un grupo de pacientes de un Hospital (tabla 2).
Es poco práctico y dificulta el análisis si se intenta intercambiar los niveles de
clasificación, solo es cómodo si se representan de derecha a izquierda o viceversa.
Selección de Lecturas de Análisis de Datos en la Cultura Física
11
Tabla 2: Resultados de las Pruebas Funcionales Respiratorias
de un Grupo de Pacientes del Hospital Calixto García
CLASIFICACIÓN INICIO
FINAL
Normal 10% 35%
Intermitente 25% 40%
Leve Persistente 30% 15%
Moderado Persistente 25% 10%
Severo Persistente 10% -
Gráfico 3
: Pruebas Respiratorias
de un Grupo de Pacientes
del Hospital Calixto Gara
0%
10%
20%
30%
40%
Normal Intermitente Leve
Persistente
Moderado
Persistente
Severo
Persistente
Inicio
Final
Gráfico 4
: Pruebas Respiratorias
de un Grupo de Pacientes
del Hospital Calixto García
0%
10%
20%
30%
40%
Severo
Persistente
Moderado
Persistente
Leve
Persistente
Intermitente Normal
Inicio
Final
Selección de Lecturas de Análisis de Datos en la Cultura Física
12
Escala de intervalos
Es una escala cuantitativa con valores discretos o continuos, casi siempre tiene
unidades de medidas (grados, centímetros, etc.) y es necesario indicar los resultados
con un valor numérico que discrimina o diferencia a los sujetos y establece el orden de
los mismos. Existe el concepto de distancia entre sujetos, caracterizado por la
diferencia de dos resultados, estas distancias se establecen en un patrón de diferencia
común independiente de los dos valores que se resten, por ejemplo: entre 8º de
temperatura y 9º hay un grado de diferencia, igual que entre 21º y 22º. El valor de cero
(0) no indica ausencia de la propiedad que se está evaluando, así una temperatura de
0º no indica ausencia de temperatura. Otro ejemplo:
La flexibilidad del tronco al frente, se mide con frecuencia subiendo al sujeto en un
banco que tiene una escala numérica, casi siempre se indica el valor de cero en el
borde del banco donde está parado el sujeto, considerando valores negativos por
encima del borde y positivos por debajo, si el individuo no llega a pasar la punta de los
dedos por debajo de sus pies se considera negativo el resultado. Aquí en valor de 0
no indica ausencia de flexibilidad ni los valores negativos flexibilidad negativa.
Para obtener resúmenes en esta escala se pueden utilizar los mismos que para las
escalas nominal y ordinal, pero el valor que mejor caracteriza al grupo es la media,
media aritmética o promedio de los datos. Para obtener las variaciones, dispersión o
concentración entre los sujetos de un grupo se calcula la desviación típica o estándar.
También puede utilizarse el rango, amplitud o recorrido.
La representación gráfica en este tipo de escala suele hacerse con el histograma. En
el gráfico 5 aparecen representados la flexibilidad en centímetros de 50 niñas donde el
cero se establece en el tope del banco utilizado para hacer la medición. En el gráfico 6
aparecen los mismos resultados pero el cero se marca en el borde inferior del banco
que tiene 20 cm. de alto.
3210-1-2-3-4-5-6
Gráfico 5: Histograma de la Flexibilidad
Frecuencia
10
8
6
4
2
0
Selección de Lecturas de Análisis de Datos en la Cultura Física
13
23222120191817161514
Gráfico 6: Histograma de la Flexibilidad
Frecuencia
10
8
6
4
2
0
Escala de proporción o razón
Esta escala es totalmente cuantitativa pues siempre el resultado es un número, puede
usarse con valores discretos o continuos casi siempre con unidades de medidas
(kilogramos, metros, etc.). Los valores de esta escala establecen el orden y las
distancias entre los sujetos, estos números indican la magnitud en que se tiene la
propiedad medida, así si un sujeto tiene el valor de 10 es porque su resultado vale el
doble del sujeto que hace 5 y vale cinco veces el resultado del que hace 2, la
proporción o razón entre dos valores de la escala se mantiene constante
independientemente de la unidad de medida que se utilice. Aquí 0 indica ausencia de
la propiedad que se mide y los valores negativos indican deuda de la propiedad. Los
siguientes ejemplos son variables en esta escala:
Peso
Talla
Tiempo en la carrera
Para obtener resúmenes en esta escala se pueden utilizar los mismos que para las
escalas nominal, ordinal y de intervalos, y fundamentalmente se utilizan los de ésta
última. Para obtener las variaciones, dispersión o concentración entre los sujetos en
un grupo se calcula la desviación típica o estándar. También puede utilizarse el rango,
amplitud o recorrido. En este tipo de escala es en el único en que se puede calcular el
coeficiente de variación. En la representación gráfica de una variable en esta escala se
suele usar el histograma pero no es posible mover el cero arbitrariamente.
Preguntas
1. Diga cuáles son las propiedades que permiten clasificar a las variables en los
diferentes tipos de escala.
2. Represente en una tabla los cuatro tipos de escalas y las propiedades
encontradas, y señale para cada escala las propiedades que contempla.
Selección de Lecturas de Análisis de Datos en la Cultura Física
14
3. Busque 10 ejemplos de escalas cualitativas y 10 de cuantitativas que estén
relacionadas con su profesión y clasifíquelas según la escala de medición en que
se encuentran.
4. Analice si en la escala de proporción o razón se mantiene el concepto de distancia.
5. Con el fin de hacer un estudio de capacidad física de los estudiantes de una
escuela se utiliza la prueba de velocidad en 50 m. y se toma el tiempo con un
cronómetro digital que mide hasta las centésimas de segundo. ¿En qué escala de
medición está esta variable? En la continuación del estudio se establece que se
valorará la velocidad de los estudiantes según la tabla:
TIEMPO EN VELOCIDAD PUNTUACION
Menos de 9,50 segundos Excelente
Entre 9,50 y 10,80 segundos Bien
Entre 10,81 y 12,10 segundos Regular
Más de 12,10 segundos Mal
Y esta puntuación se anotará como resultado del estudiante. ¿Se mantiene esta
forma de valorar la velocidad en la misma escala de medición que anteriormente?
¿Cuál es la nueva escala de medición que se está utilizando?
Recomendación
Se le recomienda al lector leer este tema en Egaña (2003), Estévez (2004), Siegel
(1970) y Zatsiorski (1989)
con un alto espíritu crítico, observando las igualdades y
diferencias con nuestro texto y escribir conclusiones de dicho análisis.
Selección de Lecturas de Análisis de Datos en la Cultura Física
15
Medidas de localización
MSc. Ramón S. Folgueira Roque
Media aritmética
Suponga que se tiene los datos de 11 niños en la prueba de salto largo sin impulso,
esta prueba se midió en metros con dos lugares decimales, vea tabla 1 donde aparece
toda la información recogida en la medición.
Tabla 1: Salto Largo.
Sujeto Resultado
1 1,15
2 1,80
3 1,80
4 2,10
5 1,80
6 1,95
7 1,85
8 1,75
9 1,95
10 2,20
11 1,90
La cantidad de datos aquí es de 11 que se indicará con N (también puede ser con n en
minúscula) y se le llama con frecuencia tamaño de la muestra.
Si se desea tener una idea del resultado general del grupo, que nos permita
comparar, por ejemplo con una próxima medición hecha a estos niños, con el objetivo
de saber si mejoraron o no los resultados; o que nos posibilite comparar con otro
grupo, supóngase, de otra escuela; o simplemente, obtener un valor que nos permita
conocer la magnitud en que este grupo de niños se comporta para esta prueba
entonces se utiliza alguna medida de localización.
La medida de localización más común conocida es el promedio de los datos que se
llama media aritmética o simplemente media (en inglés mean) que se obtiene
sumando todos los datos y dividiendo entre N. La media de los datos de la tabla 1 es
de 1,84 metros, que para niños de 12 años puede considerarse un resultado pobre,
pues le falta al grupo 16 centímetros para llegar a los dos metros.
Para obtener la media aritmética se utiliza toda la información de los datos
observados, lo que hace que mientras más alejado este un dato de la media, más la
atrae hacia sí, esto es, influye más en el valor de la media del grupo. Si eliminamos el
dato 1 que como se puede observar, esta separado del resto del grupo, la media que
se obtiene es de 1,91; este solo dato hace perder al grupo 7 centímetros en el valor de
la media.
La media se utiliza en variables que están en una escala de medición de tipo métrico o
cuantitativo.
Mediana
Existe otra medida de localización que compensa la influencia que pueden tener estos
valores extremos, en ésta cada dato influye de igual manera sobre la mediana (en
inglés median) que divide en dos grupos a los datos, de tal manera que la mitad de los
mismos esta por debajo de ella y la otra mitad por encima. En la tabla 2 (son los
Selección de Lecturas de Análisis de Datos en la Cultura Física
16
mismos datos que la tabla 1) la mediana es 1,85; observe que hay cinco datos que son
menores que la mediana y cinco mayores que la mediana.
Tabla 2: Salto Largo.
Sujeto
Resultado Relación con la Mediana
1 1,15 menor
2 1,80
menor
3 1,80
menor
4 2,10 mayor
5 1,80 menor
6 1,95 mayor
7 1,85 igual
8 1,75 menor
9 1,95
mayor
10 2,20
mayor
11 1,90
mayor
La mediana se calcula ordenando todos los datos ascendente o descendentemente y
se busca el que cae en el centro de todos ellos, para el caso donde N sea un número
par, no se obtiene un dato que los separe en dos, entonces como mediana se toma la
semisuma de los dos valores que se encuentran determinando el centro. En la tabla 3
hay diez datos ordenados en forma ascendente y la mediana cae entre 1,80 y 1,85;
siendo su valor de 1,825 aproximadamente 1,83.
Tabla 3: Cálculo de la Mediana con 10 datos.
1,15
1,75 1,75 1,80 1,80 1,85 1,90 1,95 1,95 2,10
2
85,180,1
+
=mediana
Una de las características de la mediana es que no usa toda la información de los
datos, solo la posición de estos con respecto a ella, pero los datos extremos no
afectan el valor de la mediana en la misma magnitud que lo hacen en la media. La
mediana se puede calcular en variables con escala ordinal y del tipo cuantitativo o
métrico.
Moda
Hay una medida de localización que puede calcularse en variables con cualquier tipo
de escala aunque es útil principalmente para la escala nominal y es el dato que más
se repite, el que mayor frecuencia tiene de aparición en el grupo o muestra, llamada
moda (en inglés mode). En la tabla 1 la moda es 1,80 que es el dato más frecuente
(tres veces), ninguno de los otros se repite tantas veces.
La tabla 4 indica los porcentajes de la preferencia por un deporte de un grupo de niños
en una escuela, aquí la moda es Béisbol pues es el deporte que obtuvo mayor
preferencia en la muestra de niños estudiados.
Tabla 4: Porcentaje de Alumnos en la Escuela José A. Echevarria por Deporte Preferido
DEPORTE PREFERIDO PORCENTAJE
Baloncesto 14%
Taichi 21%
Béisbol 41%
Fútbol 24%
La moda no utiliza toda la información de los datos, observe que solo se busca la
repetición de los mismos y puede suceder que en un conjunto de datos halla más de
Selección de Lecturas de Análisis de Datos en la Cultura Física
17
una moda, en la tabla 3 los datos 1,75; 1,80 y 1,95 se repiten dos veces, por tanto los
tres son moda. Puede suceder también que ninguno de los datos se repita y entonces
no hay moda para ese conjunto de datos.
Propiedades de la media, la mediana y la moda.
Estas tres medidas siempre se encuentran en las mismas unidades físicas que los
datos con que se calcularon, por ejemplo, los datos de la tabla 1 se tomaron en
metros, entonces la media de ellos son 1,93; la mediana es 1,85 y la moda 1,80; los
tres valores indican metros.
Si usted quiere interpretar los datos en centímetros, puede cómodamente transformar
a estas tres medidas en la nueva unidad física y no repetir los cálculos con los datos
en centímetros, aquí se aplica la propiedad: “cualquier transformación lineal (de suma,
resta, multiplicación o división de una cantidad fija o combinaciones de estas
operaciones con cantidades fijas) de los datos de una variable afectan de igual manera
a la media, la mediana y la moda”.
Medidas de localización
Llamadas también de posición, de tendencia central y algunos pocos autores las
llaman promedios, por una mala traducción del inglés. Como usted puede haber
observado en este documento, estas medidas caracterizan un conjunto de datos en el
sentido que permite conocer la magnitud en que se comportan estos y permiten la
comparación de grupos de datos para evaluar la diferencia, cambio, disminución,
aumento, mejoría o empeoramiento entre ellos.
En la tabla 5 se observan los resultados de una medida de localización (puede ser
igualmente la media, la mediana o la moda) para tres mediciones del número de
abdominales hechas durante el curso escolar a dos grupos de estudiantes. Se
analizarán los resultados de esta tabla:
1. Comparando los resultados durante el curso para cada grupo en particular.
2. Comparando ambos grupos en cada etapa del curso.
Tabla 5: Resultados durante el Curso del Número de Abdominales por Grupo
Inicio Mediados Final
Grupo A 10,5 10,9 12,3
Grupo B 11,0 11,0 10,2
Los resultados del análisis son:
1. Para el grupo A mejoran (aumentan) los abdominales durante el curso, ligeramente
en la primera etapa de este. El grupo B empeoran (disminuyen) los resultados en la
segunda parte del curso, manteniéndose durante la primera etapa.
2. Al inicio del curso, el grupo B tiene mejores (mayores) resultados que el grupo A, a
mediados del curso el grupo A casi alcanza al grupo B y al final el grupo A supera
al grupo B.
La variable “número de abdominales” se caracteriza porque los resultados son mejores
si aumentan, pero si estos resultados fueran de la variable “tiempo en segundos en la
carrera de 60 metros” el análisis es muy distinto, pues en esta variable los resultados
son mejores si disminuye el tiempo en la carrera. Luego es necesario tener en cuenta
las característica de la variable para hacer el análisis de la misma.
El lector puede revisar el libro de Egaña (2003) para conocer más sobre los métodos
de cálculo de estas medidas, igualmente puede referirse a cualquier libro de
Estadística a su alcance.
Selección de Lecturas de Análisis de Datos en la Cultura Física
18
Preguntas
1. Analice la tabla 6 que corresponde a las medias de dos grupos durante el curso en
la carrera de 60 metros, los datos, tomados hasta la décima de segundo,
corresponden al tiempo utilizado por cada sujeto en hacer la prueba.
Tabla 6: Medias del Tiempo en Segundos para la Carrera en
60 metros durante el Curso de dos Grupos de Estudiantes
Inicio Mediados Final
Grupo A 10,5 10,9 12,3
Grupo B 11,0 11,0 10,2
Compare el análisis hecho por usted con el efectuado en este escrito para la tabla
5, determine las diferencias entre ambos y la causa que las producen.
2. Haga una tabla con las medidas de localización estudiadas, las propiedades
particulares y las escalas donde se utiliza cada una de ellas.
Selección de Lecturas de Análisis de Datos en la Cultura Física
19
Medidas de dispersión y otras medidas
MSc. Ramón S. Folgueira Roque
Medidas de dispersión
Para caracterizar a un conjunto de datos es importante no solo tener un valor que
permita concebir la localización de los mismos, sino también, la variabilidad (variación,
dispersión u oscilación) o por el contrario, la concentración (agrupación) de este
conjunto.
Suponga que se tiene los datos de 11 niños en la prueba de salto largo sin impulso
para dos grupos, esta prueba se midió en metros con dos lugares decimales, vea
tabla 1 donde aparece toda la información recogida en la medición.
Tabla 1: Salto Largo.
Sujeto
Grupo 1 Grupo 2
1 1,15 1,70
2 1,80 1,80
3 1,80 1,80
4 2,10 1,95
5 1,80 1,80
6 1,95 1,95
7 1,85 1,85
8 1,75 1,75
9 1,95 1,85
10 2,20 1,90
11 1,90 1,90
En ambos grupos las medias, las medianas y las modas coinciden, sin embargo en el
grupo 2 los datos están más agrupados, si por ejemplo, usted quiere preparar un plan
para aumentan la capacidad de los niños, en el grupo 1, debido a su dispersión y por
tanto con el fin de individualizar el entrenamiento, posiblemente sea conveniente
formar 2 o más subgrupos de trabajo, pero en el grupo 2 no parece necesaria esta
división, por cuanto la diferencia entre los valores máximo (1,95) y mínimo (1,70) es de
25 centímetros.
Las medidas de dispersión siempre son positivas o igual a cero, en este último caso
indica que todos los datos son iguales, o sea que no hay dispersión (la concentración
es total). Mientras mayor es su valor hay más dispersión de los datos y mientras
menor es, indica mayor concentración. Así que al comparar los resultados de una
variable con alguna de estas medidas entre varios grupos o entre varias etapas de
medición, el mejor resultado es el que menor valor tiene, pues los datos se concentran
e indica mayor homogeneidad en el conjunto de datos.
No existe medida de dispersión para variables en la escala nominal. En la bibliografía
relacionada o en cualquier libro de Estadística a su alcance usted puede profundizar
sobre el cálculo de las medidas que se van a describir en este material.
Recorrido
Llamado también amplitud o rango (en inglés range) es la diferencia entre los valores
máximo y mínimo del conjunto de datos y se puede calcular en variables con escala
ordinal o del tipo métrico. Algunas veces solo se calculan estos valores y no se obtiene
la diferencia entre ellos, interpretándose los resultados de la dispersión con los
mismos.
Selección de Lecturas de Análisis de Datos en la Cultura Física
20
Desviación media
Es claro que si se obtiene la media aritmética de un conjunto de datos, la diferencia
entre cada dato y la media es la desviación individual de dicho dato con respecto al
grupo, esta desviación individual tiene signo, indicando el signo negativo que el dato
está por debajo de la media; y si el signo es positivo indica que el dato es mayor que la
media, en ambos casos la magnitud de esta desviación individual indica cuan alejado
está el dato.
En la tabla 1 el grupo 1 tiene una media de 1,84; el sujeto 4 tiene una desviación de
0,26 (2,10 – 1,84) y la desviación del sujeto 5 es –0,04 (1,80 – 1,84), el sujeto 4 está
más separado de la media que el sujeto 5, pero este último tiene un resultado en el
salto menor que la media del grupo (lo indica el signo negativo), mientras que el sujeto
4 tiene un valor mayor que la media (el signo positivo no se indica al escribir los
números).
Se le recomienda calcular las desviaciones de los sujetos 7, 8 y 9 del grupo 1 en el
salto largo (tabla1) para familiarizarse con este concepto.
La desviación media o desviación promedio (en inglés mean deviation), es el promedio
de las desviaciones individuales absolutas (sin el signo). En la tabla 2 se muestran las
desviaciones individuales y absolutas de cada sujeto, ahora se obtiene el promedio de
la última columna y la desviación media de estos datos es 0,16 metros.
Tabla 2: Salto Largo del Grupo 1
Sujeto Dato Desviación Desviación Absoluta
1 1,15 -0,69 0,69
2 1,80 -0,04 0,04
3 1,80 -0,04 0,04
4 2,10 0,26 0,26
5 1,80 -0,04 0,04
6 1,95 0,11 0,11
7 1,85 0,01 0,01
8 1,75 -0,09 0,09
9 1,95 0,11 0,11
10 2,20 0,36 0,36
11 1,90 0,06 0,06
Media
1,84
La desviación media se utiliza para escalas cuantitativas.
Desviación típica
La desviación típica o desviación estándar (en inglés standard deviation), este último
nombre lo recibe por una reiterada y errada traducción del inglés, es la medida más
utilizada y de más difícil interpretación, caracteriza perfectamente la dispersión de los
datos alrededor de la media en escalas cuantitativas.
En el cálculo se procede sumando los cuadrados de las desviaciones individuales de
los datos (observe que se elimina el signo) y esta suma se divide entre N – 1, o sea,
considerando que se ha eliminado un dato por cálculo de la media. El resultado
obtenido aquí se le llama varianza. Entonces para compensar los cuadrados hechos,
se obtiene la raíz cuadrada de la varianza y el resultado es la desviación típica.
Propiedades del recorrido, la desviación media, la desviación típica.
Todas estas medidas mantienen las unidades físicas de los datos y si se suma o resta
una cantidad fija a los datos, estas medidas no sufren transformación. Sin embargo si
se multiplican o dividen los datos por una cantidad fija, ellas también se multiplican o
dividen por esa cantidad.
Selección de Lecturas de Análisis de Datos en la Cultura Física
21
Coeficiente de variación
El coeficiente de variación (en inglés coefficient of variation) se obtiene dividiendo la
desviación típica entre la media aritmética y multiplicando por 100 para obtener un
valor en porcentaje de la relación de estos dos números, no tiene unidades físicas y no
cambia su valor por transformaciones lineales de los datos. Este coeficiente permite, al
no tener unidades físicas pues su resultado siempre es en por ciento, comparar
dispersiones de diferentes variables y se utiliza solamente en la escala de razón o
proporción.
Zatsiorski (1989) propone una escala (tabla 3) para evaluar el grado de oscilación de
los datos según el coeficiente de variación.
Tabla 3: Oscilación de los Datos según Zatsiorski
Coeficiente de Variación Oscilación
De 0 a 10% Pequeña
De 11 a 20% Media
Más de 20% Grande
Otras medidas
Existen otras medidas que no son exactamente de localización o dispersión, pero que
ayudan a interpretar los resultados.
Cuartil: en inglés quartile. Recuerde como se calcula la mediana, ahora cada mitad
determinada por la mediana se divide en la mitad, obteniendo cuatro conjuntos
de datos que contienen cada uno el 25% de los datos:
Entre el valor mínimo y el primer cuartil (simbolizado con Q
1
).
Entre el primer cuartil y la mediana (o segundo cuartil Q
2
).
Entre la mediana y tercer cuartil (Q
3
).
Entre el tercer cuartil y el valor máximo.
Estos valores permiten interpretar la variabilidad en cada cuarta parte de los
datos y la localización de los dos conjuntos centrales que contienen el 50% de
los datos interiores.
A la diferencia entre los cuartiles 1 y 3 se le llama recorrido o rango
intercuartílico, que es una medida de dispersión del conjunto de datos.
Percentil: en inglés percentile. Se calcula para cualquier porcentaje de datos, por
ejemplo P
20
es el percentil 20 que indica el valor que divide al conjunto de
datos en dos partes, los valores menores que P
20
, que son el 20% de los datos
y el resto, el 80% (100% – 20%) de los datos que todos son mayores que el
percentil 20.
En general P
x
es el percentil x que divide en dos grupos a los datos: los valores
menores que él, que son el x% de los datos y los valores mayores que él, que
son el (100 – x)% de los datos.
Si usted halla dos percentiles diferentes siempre es mayor el que señala el
mayor porcentaje, así P
75
es mayor que P
25
.
Algunos percentiles pueden coincidir numéricamente y esto sucede cuando el
número de datos procesados en pobre.
En la tabla 4 aparecen los datos de la prueba de salto largo sin impulso de 40
sujeto y en la tabla 5 sus percentiles 10; 20; 30; 40; 50; 60; 70; 80 y 90.
Observe como aumenta el valor numérico de estos. Compruebe que entre cada
dos de ellos consecutivos hay el 10% de los datos (4 datos).
Selección de Lecturas de Análisis de Datos en la Cultura Física
22
Tabla 4: Datos del Salto Largo de 40 Sujetos
1,76
2,03 1,80 1,98 1,81 1,89 1,87 1,76
1,79 1,76 1,96 2,20 1,87 1,97 1,94 2,08
1,82 1,83 1,93 2,00 1,74 1,82 1,94 1,82
1,72 1,76 1,82 1,80 2,02 2,02 1,86 2,11
1,72 1,98 1,88 1,91 1,74 2,01 2,02 1,99
Tabla 5: Percentiles del Salto Largo de la Tabla 4
% 10 20 30 40 50 60 70 80 90
Percentil 1,755 1,788 1,814 1,823 1,879 1,931 1,975 2,006 2,021
Trabajo independiente
Le proponemos al lector que utilice al menos dos conjuntos de datos, bien sea de
diferentes grupos o de mediciones repetidas hechas al mismo grupo de sujetos en
tiempos diferentes y que estén relacionados con su trabajo, y proceda de la siguiente
manera:
1. Calcule todas las medidas de localización y dispersión posibles en un software
estadístico (la mayoría son posibles en EXCEL en las funciones estadísticas).
2. Confeccione tablas para cada medida calculada.
3. Analice cada una de las tablas.
Pregunta
Diga con quienes de la medidas estudiadas coinciden:
El percentil 25
El percentil 50
El percentil 75
Selección de Lecturas de Análisis de Datos en la Cultura Física
23
Probabilidades
MSc. Reina Acosta Rodríguez, MSc. Vilma Hernández Rey y
MSc. Antonio Varona Rojas
Introducción
La teoría de las probabilidades surge en los siglos XVI-XVIII relacionada con
problemas de los juegos de azar; dentro de los principales precursores de esta teoría
están Pascal, Fermat, Bernoulli, Laplace y otros.
Esta teoría hasta la actualidad ha estado vinculada al desarrollo de las herramientas
matemáticas, lográndose una teoría general de esta ciencia. Podemos decir que la
Teoría de las Probabilidades es la ciencia que estudia las regularidades de los
fenómenos aleatorios frecuentes (estos son, las desviaciones de lo regular originadas
por una infinidad de vínculos no previstos en el fenómeno dado), es decir, fenómenos
aleatorios que prácticamente pueden ser observados un número limitado de veces en
las mismas condiciones.
A medida que se desarrolla cualquier rama de la ciencia, siempre surge en cierta
etapa la necesidad de tener en consideración las desviaciones accidentales y su
influencia sobre el curso de los fenómenos por estudiar. Por ello, toda rama aplicada
de la ciencia tiene que acudir a la Teoría de las Probabilidades y cada día se amplían
más los campos de aplicación de los métodos estadísticos
Experimento aleatorio. Espacio muestral. Suceso o evento.
Es muy común que en varias esferas de la vida, y en especial en la investigación, nos
relacionemos con experimentos, definidos estos como la acción de experimentar que
no es más que probar en la práctica una cosa (Tomado del Pequeño Larousse
Ilustrado), por lo que se hace sumamente necesario para nuestro estudio definir el
concepto de Experimento Aleatorio.
Definición: Un experimento se considera aleatorio cuando no
se puede predecir con toda exactitud su resultado
antes de realizarlo, es decir, es producto del azar.
Como ejemplos de experimentos aleatorios se puede citar:
1. Lanzamiento del balón al aro en el Baloncesto.
2. Obtención del lugar en una competencia nacional por parte de un equipo
provincial.
3. Obtención de una calificación en un examen de Análisis de Datos por parte de un
estudiante.
4. Observar la puntuación obtenida por una atleta en un evento de Gimnasia
Artística.
5. Observar la marca alcanzada por un atleta en la prueba de Salto de Longitud.
6. El incremento del rendimiento deportivo de atleta durante un período del
entrenamiento.
7. La disminución del peso de un obeso después de aplicado un tratamiento.
8. El incremento de las capacidades físicas de niños escolares bajo la influencia de
la Educación Física.
Para los fines que persiguen los métodos estadísticos, los experimentos aleatorios
deben tener la característica de poderlos repetir, como es el caso de observar
determinado fenómeno.
Selección de Lecturas de Análisis de Datos en la Cultura Física
24
Definición: Un espacio muestral es el conjunto formado por todos los
posibles resultados de un experimento aleatorio. Estos se pueden
representar en forma de conjunto o a veces en forma gráfica.
Para los tres primeros ejemplos de experimentos aleatorios dados, se tiene que los
espacios muestrales correspondientes son:
1. {NE, E} NE No Encesta, E Encesta
2. {1
0
, 2
0
, 3
0
,..., 14
0
}
3. {2, 3, 4, 5}
Para los restantes ejemplos de experimentos aleatorios dados, en muchas ocasiones
no se tiene delimitado el rango en que toma valores lo observado, pudiéndose decir
que es un conjunto más general.
El espacio muestral lo denotaremos por S y este puede ser finito o infinito, según el
conjunto tenga un número finito o infinito de elementos respectivamente. Los ejemplos
1-3 son de espacios muestrales finitos, los restantes se refieren a espacios muestrales
infinitos.
Definición: Un suceso o evento es un subconjunto del espacio muestral
que lo denotaremos con las letras mayúsculas del alfabeto.
Se establece que un suceso ocurre cuando se presenta al menos uno de los
resultados que lo componen.
Como ejemplos de sucesos o eventos podemos citar:
1. Cuando al lanzar una pelota al aro en el Baloncesto se enceste, esto se puede
expresar como el conjunto {E}, que es un subconjunto de S = {NE, E}
2. Cuando al participar en una competencia nacional el equipo Villa Clara obtenga
uno de los tres primeros lugares, el conjunto es {1
0
, 2
0
, 3
0
} que es un subconjunto
de S = {1
0
, 2
0
, 3
0
,..., 14
0
}
3. Cuando al presentarse al examen de Análisis de Datos un estudiante alcanza la
evaluación de Excelente (5) habiendo obtenido 3 como calificación, el conjunto es
nulo o vacío.
4. Presentarse a examen en la asignatura Análisis de Datos y obtener alguna
calificación, es decir el conjunto es {2, 3, 4, 5} que coincide con el espacio
muestral.
Tipos de sucesos
Un suceso o evento puede ser elemental o simple si consta de un solo elemento o no
elemental o compuesto si consta de dos o más elementos. En los ejemplos anteriores
el primero es simple y el segundo es compuesto.
Se dice que un suceso es cierto o seguro si este ocurre necesariamente como
resultado del experimento en cuestión. El ejemplo 4 es un suceso cierto o seguro.
En resumen un suceso es cierto o seguro si está asociado con todos los elementos del
espacio muestral.
Se dice que un suceso es imposible o nulo si este no puede ocurrir como resultado del
experimento en cuestión. Por ejemplo, cuando un estudiante obtiene la calificación de
3 puntos en el examen de Análisis de Datos y tiene derecho a presentarse a Examen
de Premio. Este suceso lo designamos por la letra griega [ que denota el conjunto
vacío.
El espacio muestral S y cualquier suceso L asociado a un experimento aleatorio se
pueden representar gráficamente mediante un diagrama de Venn.
Selección de Lecturas de Análisis de Datos en la Cultura Física
25
S
Operaciones con sucesos
En las aplicaciones de la teoría de las probabilidades se tratará muchas veces con
sucesos relacionados entre sí. Si consideramos que A y B son dos sucesos de un
espacio muestral S, entonces A+B representa el suceso que ocurra A, ocurra B u
ocurran ambos, llamándose al suceso A+B suma o unión de los sucesos A y B.
También se utiliza AUB de la Teoría de Conjunto e igualmente se utiliza la notación
A o B.
Para el caso de un experimento aleatorio definido, AB representa el suceso que
ocurran A y B simultáneamente; al evento AB se le llama producto o multiplicación de
los sucesos A y B. Otras notaciones que se utilizan son A\B y A*B.
Ejemplo:
En el experimento aleatorio que se presenta al ir al bate un pelotero el espacio
muestral es:
S = {BB, P, H, D, T, Hr} (BB: base por bola, P: ponche, H: hit, D: doble, T: triple,
Hr: jonrón)
Sean los siguientes sucesos:
A: que no conecte: A = {BB, P}
B: que no sea base por bola B = { P, H, D, T, Hr}
Hallemos A+B y AB
Entonces A+B = { BB, P, H, D, T, Hr} (suceso cierto o seguro)
AB = {P}
Las siguientes figuras muestran los diagramas de Venn para AB y A+B
respectivamente:
S
S
L
Selección de Lecturas de Análisis de Datos en la Cultura Física
26
La adición y el producto de sucesos se pueden extender a más de dos sucesos.
Se le llama suceso complementario de A en S, y se denota A
c
al conjunto formado por
los elementos de S que no pertenecen al suceso A. El siguiente diagrama muestra los
sucesos A y A
c
S
en la figura se puede observar que A + A
c
= S
Ejemplo:
En el experimento aleatorio del ejemplo anterior el suceso A que representa que
no conecte es complementario del suceso A
c
que representa que conecte. Los
sucesos A y A
c
se pueden expresar como:
A = {BB, P} y A
c
= {H, D, T, Hr}
Si se busca el suceso AUA
c
, se tiene que:
AUA
c
= {BB, P, H, D, T, Hr} = S
Definición clásica y estadística de probabilidad
Con el desarrollo histórico, los diferentes enfoques del cálculo de probabilidades han
sufrido transformaciones sucesivas, llegando a aplicarse actualmente a diversos
problemas planteados por el desarrollo científico-técnico.
La probabilidad como medida numérica de la posibilidad real de ocurrencia de un
suceso, se ha expresado mediante diferentes definiciones, como son la definición
clásica y la definición estadística de probabilidad que se exponen a continuación.
Se puede decir que la probabilidad es un número que caracteriza la posibilidad de que
se produzca un suceso.
Definición: Se llama probabilidad de un suceso, desde el punto de
vista clásico, al cociente del número de resultados que
son favorables al suceso y el número total de resultados
elementales e igualmente posibles del experimento.
Por lo que la probabilidad del suceso A se expresa como:
P(A) =
N
N
A
Donde
A
N es el conjunto de resultados elementales favorables al suceso A y N es el
número de todos los resultados elementales posibles del experimento.
Esta definición clásica es aplicable a espacios muestrales finitos.
Si A fuera un suceso cierto o seguro se tendría que:
P(A) =
N
N
A
=
N
N
= 1
En este caso N
A
= N porque cada resultado elemental es favorable al suceso A, ya que
A = S.
Si A fuera un suceso imposible o nulo tendríamos:
Selección de Lecturas de Análisis de Datos en la Cultura Física
27
P(A) =
N
N
A
=
N
0
= 0
Y en este caso N
A
= 0 porque ninguno de los resultados elementales del experimento
aleatorio son favorables al suceso A.
Ejemplos:
1. Si se lanza el balón al aro en el Baloncesto hallemos la probabilidad del suceso
A: Enceste y del suceso B: No enceste
El espacio muestral es S = {NE, E} y se tiene A = {E} y B = {NE} por lo tanto:
P(A) = ½ y P(B) = ½
2. Si se realizan tres tiros libres en el Baloncesto, hallemos la probabilidad del
suceso A: se anote una canasta.
El espacio muestral es:
S = {
E E E, NE E E, E NE E, E E NE, NE NE E, NE E NE, E NE NE, NE NE NE} y el
suceso A es el conjunto A = {E NE NE, NE E NE, NE NE E} por lo tanto
P(A) = 3/8
3. Si se lanzan dos dados, ¿cuál es la probabilidad de que las caras que caigan
hacia arriba: a) sumen 7?, b) sumen menos de 6?
El espacio muestral en este caso es:
S =
a) Tenemos que A = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)} por lo tanto la probabilidad de
A es
P(A) =
6
=
6
1
b) Si B es el suceso de que las caras que caigan hacia arriba sumen menos de 6,
tenemos que:
C = {(1,1), (1,2), (1,3), (1,4), (2,1), (2,2), (2,3), (3,1), (3,2), (4,1)} por lo tanto la
probabilidad de C es: P(C) = 10/36 = 5/18
La definición clásica de probabilidad presupone que el número de resultados
elementales del experimento sea finito y estos sean elementales e igualmente posibles
y en la práctica con frecuencia se encuentran experimentos en los que no se cumplen
estas condiciones, por lo que en estos casos la definición clásica no es aplicable. Por
lo expuesto se ha planteado la definición estadística de probabilidad la cual se
basa en el concepto de frecuencia relativa de ocurrencia de un suceso, que se
define como “el número de veces que ocurra el suceso en las veces que se repita el
experimento”, la cual, para un suceso A, se calcula como sigue:
f
r
(A) =
n
f
A
donde
A
f denota el número de veces que ocurre A y n es el número total de pruebas
realizadas.
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
Selección de Lecturas de Análisis de Datos en la Cultura Física
28
La experiencia ha demostrado que si se efectúa un experimento aleatorio con mucha
frecuencia en iguales condiciones, la frecuencia relativa de ocurrencia de un suceso
tiende a ser constante, en este caso se dice que el suceso en cuestión muestra
r
egularidad estadística o estabilidad de las frecuencias relativas. Esto significa
que en un experimento la frecuencia relativa experimenta menos cambio cuanto mayor
sea el número de veces que este se repita, oscilando alrededor de cierto número
constante, siendo este número la probabilidad de ocurrencia del suceso.
Ejemplo: si lanzamos una moneda un gran número de veces y observamos el número
de caras que aparecen se verá que mientras mayor sea el número de
repeticiones, la frecuencia relativa de ocurrencia de cara oscilará alrededor
de ½ que es la probabilidad de ocurrencia de cara.
Sucesos independientes
Definición: Dos sucesos A y B se llaman independientes, cuando la probabilidad de
ocurrencia de uno de ellos no depende de la ocurrencia o no del otro.
Ejemplos:
1. Si se lanza una moneda dos veces, la probabilidad de que salga cara en el
primer lanzamiento (suceso A), no depende de que salga o no cara en el
segundo lanzamiento (suceso B); de igual forma, la probabilidad de que salga
cara en el segundo lanzamiento no depende de que salga cara o no en el
primer lanzamiento; en consecuencia, los sucesos A y B son independientes.
2. Si dos atletas lanzan una pelota al aro, la probabilidad de que el primero
enceste (suceso A) no depende de que lo haga el segundo (suceso B) y
viceversa, por tanto los sucesos A y B son independientes.
Dos sucesos se consideran dependientes si la ocurrencia de uno esta condicionada a
la ocurrencia del otro. Por ejemplo, al lanzar dos dados el suceso A consistente en que
la suma de los números obtenidos sea par y el suceso B consistente en que en cada
dado salga un número impar, son dependientes.
La definición de sucesos independientes se puede generalizar para más de dos
sucesos. En Guerra (1987) se dice:
Varios sucesos se llaman independientes en el conjunto, si cada uno de ellos y
cualquier combinación de los demás sucesos (que contiene todos los restantes
sucesos o parte de ellos), son sucesos independientes.
Se debe señalar que si varios sucesos son independientes de dos en dos, eso no
significa su independencia en el conjunto, ya que el requisito de independencia de los
sucesos en el conjunto es más amplio que el de independencia por pareja.
Sucesos mutuamente excluyentes
Definición: En un mismo experimento aleatorio, dos sucesos A y B se dice que son
mutuamente excluyentes, si la ocurrencia de uno excluye la ocurrencia
del otro. Esto es el suceso AB = [, por tanto se tiene que P(AB) = 0.
Ejemplo: En el Baloncesto, en el lanzamiento del balón al aro realizado por un atleta,
la ocurrencia de encestar (suceso A) excluye la ocurrencia de no encestar (suceso B).
La noción de sucesos mutuamente excluyentes o no mutuamente excluyentes,
siempre está relacionado con el experimento aleatorio que se tenga en cuenta, ya que
los sucesos pueden resultar mutuamente excluyentes en un experimento y no
mutuamente excluyentes en otro experimento.
Ejemplo: Si en el ejemplo anterior el lanzamiento lo realizaran dos atletas diferentes A
fuera no excluyente de B.
Se debe señalar que si dos sucesos son mutuamente excluyentes entonces son
dependientes.
Selección de Lecturas de Análisis de Datos en la Cultura Física
29
Si analizamos los sucesos A y A
c
se puede concluir que estos son mutuamente
excluyentes, ya que la ocurrencia de uno excluye la ocurrencia del otro , por lo que el
suceso AA
c
= [ y por tanto se tiene que P(AA
c
) = 0
Los sucesos A
1
, A
2
, A
3
, ..., A
n
se dice que son mutuamente excluyentes si ningún par
de ellos puede ocurrir conjuntamente, esto significa que el suceso A
i
A
j
= [, por tanto
P(A
i
A
j
) = 0, para cualquier i y cualquier j, siendo i _ j.
Reglas de probabilidad
1.- 0 7 P(A) 7 1
Partiendo de la definición clásica de probabilidad, si A es un suceso tendremos
que:
0 ` N
A
3 N, si dividimos los tres miembros de la desigualdad por N, se tendrá que:
0 `
N
A
N
3 1, por lo tanto 0 7 P(A) 7 1. esta propiedad establece que la
probabilidad no puede ser ni negativa ni exceder a 1, siendo 0 el valor de la
probabilidad del suceso nulo y 1 el valor de la probabilidad del suceso seguro.
2.- Regla especial de suma
Si A y B son sucesos mutuamente excluyentes entonces P(A + B) = P(A) + P(B).
En otras palabras, si A y B son mutuamente excluyentes la probabilidad de que
cualquiera de los dos ocurra es igual a la suma de sus probabilidades
3.- P(A
c
) = 1 P(A)
Teniendo en cuenta que A y A
c
son mutuamente excluyentes y que (A + A
c
) es un
suceso seguro cuya probabilidad es igual a 1 tendremos que:
P (A + A
c
) = P(A) + P(A
c
)
1 = P(A) + P(A
c
)
por lo que P(A
c
) = 1 P(A)
4.- Regla especial de multiplicación.
Si A y B son sucesos independientes, entonces P(A y B) = P(A) . P(B)
Esto quiere decir que la probabilidad de ocurrencia de dos sucesos independientes
es igual al producto de sus probabilidades independientes.
Variable aleatoria
El concepto de variable aleatoria constituye uno de los más utilizado en las
estadísticas, pues todos los datos se manejan a nivel del valor de una variable, por lo
que es de gran importancia que quede bien clara su definición la cual basaremos en
conceptos conocidos como es el de variable propiamente dicho.
Podemos definir una variable como “un símbolo alfabético que puede tomar cualquier
valor en un conjunto dado al cual se denomina dominio de definición de la variable”,
generalmente se utiliza como nombre de una variable las últimas letras del alfabeto (x,
y, z) pero no quiere esto decir que no pueda utilizarse otra letra cualquiera para
identificar una variable.
Una variable aleatoria es aquella que puede determinarse cuantitativamente y que
tiene un carácter aleatorio, pues en distintas observaciones de la misma categoría,
puede adoptar valores diferentes, no determinísticamente precisados.
Según Guerra (1987) “es una función definida en un espacio muestral dado, que toma
valores en R (conjunto de números reales)”
Selección de Lecturas de Análisis de Datos en la Cultura Física
30
Una variable aleatoria es aquella que como resultado de observar un experimento
aleatorio toma uno y solamente un valor posible de antemano desconocido y
dependiente de causas fortuitas que previamente no se pueden tener en cuenta.
La determinación de una variable aleatoria supone, por tanto, la determinación del
conjunto de valores que puede tomar efectivamente la variable y además la
probabilidad con que ellos pueden ser tomados.
Tipos de variables aleatorias
Existen dos tipos de variables aleatorias: discretas o continuas.
Se dice que una variable aleatoria es discreta si toma valores posibles individuales
aislados con probabilidades determinadas.
Ejemplo: La variable X representa el número de canastas al realizar tres tiros libres por
parte de un atleta, lo cual podemos expresar en la siguiente tabla
S X P(X)
E E E 3 1/8
E E NE
NE E E
E NE E
2
3/8
NE NE E
NE E NE
E NE NE
1 3/8
NE NE E 0 1/8
1
Cada valor de la variable tiene asociado un valor de la probabilidad y la suma de las
probabilidades para todos los valores de la variable es 1, lo cual ocurre para toda
variable aleatoria discreta.
Otro ejemplo de variable discreta puede ser el sexo de una persona: Femenino o
Masculino, a los cuales podemos asignarles valores numéricos para un mejor
tratamiento (podía ser Femenino = 1 y Masculino = 2 o viceversa).
Se dice que una variable aleatoria es continua si puede tomar todos los valores de un
cierto intervalo finito o infinito.
Ejemplos de variables continuas:
a) La estatura de un grupo de atletas.
b) La disminución del peso de un grupo de obesos después de aplicado cierto
tratamiento.
c) Los tiempos hechos por un grupo de atletas en la carrera de 100 metros planos.
La curva normal
La curva normal es la piedra angular de la teoría estadística moderna. Su estudio
matemático se remonta al siglo XVIII, cuando los científicos observaron un grado
sorprendente de regularidad en los errores de las medidas, esto es en las medidas
repetidas de una y solo una misma cantidad. Encontraron que las distribuciones o
patrones que observaron estaban aproximados con bastante exactitud por una curva
de distribución, a la cual ellos se referían como la “curva normal de errores”,
atribuyéndola a las leyes de la casualidad.
Esta distribución fue introducida por Carl F. Gauss en relación a la teoría de los errores
de medidas físicas, es por ello que también reciben el nombre de distribuciones de
Gauss o gaussianas.
No es interés nuestro mostrar esta distribución desde el punto de vista matemático
(estrictamente), para que puedan comprender de forma fácil su interpretación
geométrica nos basaremos únicamente en su representación gráfica.
Selección de Lecturas de Análisis de Datos en la Cultura Física
31
La figura muestra la curva que representa esta distribución, la cual es simétrica
respecto a x = a (donde a es la media de dicha distribución).
Las principales características de la curva normal son:
a) La función está definida en todo el eje X.
b) Para todos los valores de x, la función toma valores positivos, es decir, la curva
normal está situada sobre el eje X.
c) A medida que la variable crece ilimitadamente (en valor absoluto) la función se
acerca al eje Y, es decir, el valor de la función tiende a cero.
d) La función alcanza su mayor valor para x = a
En lo sucesivo, nos veremos en la necesidad de analizar si un conjunto de valores
sigue una distribución normal, para ello no basta con representarlos en un sistema de
coordenadas y comprobar de forma visual si estos se acercan al menos a la curva
normal.
Selección de Lecturas de Análisis de Datos en la Cultura Física
32
Comparación de poblaciones
Dra. C. Magda Mesa Anoceto y MSc. Ángela Díaz de Villegas Reguera
Breve introducción a las pruebas de hipótesis
Cuando pensamos en darle solución a un problema en el cual queremos comparar
poblaciones podemos aplicar la teoría de las pruebas de hipótesis.
Es importante considerar que se presenta un par de hipótesis. Una de ellas es la
hipótesis fundamental o nula, denotada por H
o
mientras la otra es la hipótesis que la
contradice, la hipótesis alternativa denotada por H
1
. La hipótesis fundamental H
o
puede ser cierta o falsa y la verificación de ella se realiza por métodos estadísticos.
La verificación estadística consiste esencialmente en comprobar si una determinada
variable estadística (estadígrafo) tiene, para la muestra, los valores que pudieran ser
esperados si la hipótesis fundamental fuera cierta.
Por tanto, la teoría de la inferencia estadística o teoría de los tests de hipótesis se
ocupa de buscar para hipótesis típicas, una variable aleatoria especialmente
escogida, cuya distribución exacta o aproximada es conocida cuando la
hipótesis fundamental es cierta. Esta variable estadística -denominada estadístico,
estadígrafo o criterio estadístico- y su distribución condicionada a la hipótesis
fundamental proporcionan el criterio de decisión.
Si el valor concreto del estadígrafo en la muestra está fuera de los rangos probables,
la hipótesis fundamental se rechaza y se acepta la hipótesis alternativa. Por otra parte,
si su valor concreto en la muestra se encuentra en los rangos probables de los valores
de la variable conocida a partir de la distribución condicionada a H
o
, no existe razón
para rechazar esta hipótesis y entonces se acepta.
Otro concepto importante al formular las hipótesis y seleccionar el estadígrafo es el
tipo de error. Al hacer verificaciones estadísticas se pueden producir errores de dos
tipos.
Error de tipo I: Rechazar una hipótesis verdadera, por ejemplo, rechazar H
o
cuando H
o
es cierta.
Error de tipo II: No rechazar una hipótesis falsa, por ejemplo, no rechazar H
o
cuando
realmente H
o
es falsa.
Se denomina en general ¨significación del test¨ a la probabilidad de error del tipo I
con el estadígrafo seleccionado:
= Prob (Error de tipo I con el estadígrafo seleccionado)
= Prob (Rechazar H
o
con el estadígrafo seleccionado cuando H
o
es cierta)
y se pone especial énfasis en controlar este tipo de error.
En la práctica el investigador puede prefijar un nivel de significación para compararlo
con la significación del test. Los valores más utilizados son 0.01, 0.05, 0.10. (1%, 5%,
10%). ¿Cuál elegir?. La respuesta depende de la gravedad de las consecuencias de
los errores para cada problema concreto. Por ejemplo, si un error de tipo I da lugar a
grandes pérdidas y uno de tipo II a pequeñas pérdidas hay que seleccionar el más
pequeño posible, o sea, 0.01. Como regla general se trabaja con una significación del
5%. Cuando se desea imponer fuerza a la conclusión de rechazo de la hipótesis se
trabaja con significación del 1%. Por el contrario, cuando se trata de investigaciones
preliminares cuyo objetivo es encontrar cualquier aspecto que sea potencialmente
significativo, se trabaja con niveles de significación del 10%.
Se denota la probabilidad de cometer un error de tipo II por la letra griega . Esto es:
=Prob (Aceptar H
o
con el estadígrafo seleccionado cuando H
o
es falsa).
Selección de Lecturas de Análisis de Datos en la Cultura Física
33
Para un tamaño dado de muestra, no es posible reducir simultáneamente y . Si se
reducen las exigencias de , entonces crecerá. La única forma de disminuir las
probabilidades de error de tipo I y II es aumentando el tamaño de las muestras, lo cual
sabemos que no siempre es posible.
El valor:
1- = Prob (no cometer error de tipo II) .
1- = Prob (Rechazar H
o
con el estadígrafo dado cuando H
o
es falsa)
se denomina potencia del criterio.
La teoría de la inferencia estadística busca estadígrafos cuya distribución exacta o
aproximada es conocida cuando la hipótesis fundamental es cierta. Para formular los
tests escoge aquellos que sean ¨ más sensibles ¨ al incumplimiento de la hipótesis
fundamental de modo que permite trabajar con bajos niveles de significación y obtener
la máxima potencia del criterio.
Comparación de dos poblaciones. Pruebas de hipótesis paramétricas y no
paramétricas.
A continuación estudiaremos la forma de comparar una variable aleatoria entre dos
poblaciones. Si la variable aleatoria fuera discreta con un número bastante reducido de
valores posibles, las tablas de contingencia resuelven completamente el problema. Si
la variable aleatoria es continua o al menos ordinal existen métodos más fuertes de
comparación entre dos poblaciones.
Si se quiere podemos comenzar pensando en una variable aleatoria continua que va a
ser comparada entre dos grupos independientes o en un mismo grupo en dos
momentos diferentes. Desde este punto de vista se trata de precisar la posible
dependencia de esa variable aleatoria continua respecto a una variable aleatoria
discreta, concretamente dicotómica: el grupo o el momento.
Estas ideas se extienden al caso en que la variable objeto de estudio es ordinal en
lugar de continua.
Esquema general de comparación de dos poblaciones
Comencemos planteando un problema ejemplo. Se quiere experimentar un nuevo
método para la educación de todas las capacidades físicas y motrices. La superioridad
del nuevo método debería medirse por el nivel de eficiencia física alcanzado. Para ello
se aplica una batería de pruebas: rapidez, planchas, abdominales, salto de longitud sin
carrera de impulso y resistencia. La experiencia debería ser validada con todo rigor
antes de emprender su generalización. Ilustraremos lo que deseamos con la prueba
rapidez.
Si diseñó el experimento de la forma siguiente:
1ro. Se seleccionaron dos grupos de composición similar en edad y sexo y se eligió
aleatoriamente uno como experimental y otro como control.
2do. Se decidió realizar la prueba de rapidez a todos los investigados de ambos
grupos antes de comenzar como tal el experimento. Esta prueba consistió en
correr 50 metros y se midió el tiempo con precisión de una décima. Se registraron
las mediciones realizadas a nivel individual.
3ro. El grupo experimental recibió entonces la preparación supuestamente superior. El
grupo de control recibió la preparación por el método tradicional.
4to. Al finalizar la preparación, se repitió la prueba con los investigados de ambos
grupos, en idénticas condiciones que la inicial.
Los datos primarios pudieron organizarse en la siguiente forma:
Selección de Lecturas de Análisis de Datos en la Cultura Física
34
I
nvestigado Grupo
P
rueba1
P
rueba2
Ramón Pérez 1 8,2 7,2
Luis Márquez 1 8,4 7,4
. . . .
. . . .
. . . .
Jorge Rojas 1 7,8 7,2
Ricardo García 2 8,7 8,5
Alicia Morales 2 7,4 -1
. . . .
. . . .
. . . .
José Rodríguez 2 8,5 8,0
Realmente el nombre como tal del investigado no es un dato procesable, pero fue
importante durante la captación primaria de los datos para asegurar que fueran
apareados los resultados de la primera y segunda prueba. En el fichero de datos que
vamos a procesar estadísticamente el nombre del investigado puede ser sustituido por
las iniciales o incluso por un número consecutivo, apenas con el objetivo de poder
rectificar cualquier dato a partir de las plantillas iniciales en caso de duda.
A pesar que una parte importante del aseguramiento del experimento era lograr que el
100% de los investigados realizaran ambas pruebas de rapidez, hubo inevitablemente
casos que faltaron a una de las dos pruebas. La medición registrada en tal caso fue -1
para identificarlo como un valor perdido. Los investigados que no realizaron ninguna
de las dos pruebas o que no recibieron la preparación regularmente fueron separados
del procesamiento. Nótese que el número de investigados en ambos grupos es el
mismo, pero no necesariamente tiene que ser así.
El procesamiento estadístico a realizar para evaluar el experimento supone cuatro
comparaciones de acuerdo al siguiente esquema.
La comparación vertical V
1
de la prueba 1 entre los dos grupos, es una comparación
de muestras independientes (los resultados de la prueba en el grupo 1 son
independiente de los resultados de la prueba en el grupo 2). Esta comparación es
Prueba 1
Prueba 2
Grupo1
(Experimental
)
Grupo2
(Control)
H
1
H
2
V
1
V
2
Selección de Lecturas de Análisis de Datos en la Cultura Física
35
importante para validar la selección del grupo de control. Es deseable en este caso
que no arroje diferencias significativas entre los grupos.
La comparación vertical V
2
de la prueba 2 entre los dos grupos es también una
comparación de muestras independientes y expresará los resultados más importantes
del experimento. Es deseable en este caso que arroje diferencias significativas a favor
del grupo experimental.
Las comparaciones horizontales H
1
y H
2
, se realizan en cada grupo por separado entre
la prueba 1 y la prueba 2. Es importante comprender el por qué estas comparaciones
son necesarias, esto es, por qué no basamos nuestras conclusiones simplemente en
los resultados de V
1
y V
2
si estas resultan como deseamos. La cuestión esencial es
que H
1
y H
2
como comparaciones horizontales esclarecen la tendencia individual de
los cambios.
Para ejemplificar esto, supongamos que nuestros grupos se limitan a cuatro
investigados con los resultados siguientes:
Prueba 1
Prueba 2
8,2 7,2
8,4 7,4
7,8 6,8
Grupo 1
7,5 7,2
8,7 8,5
7,2 7,1
7,4. 7,2
Grupo 2
8,5. 8,0
La comparación V
1
arrojará que no hay diferencias en la Prueba 1 y la comparación V
2
reflejará que los resultados de la Prueba 2 en el Grupo 1 son mejores que el Grupo 2,
esto es, V
1
y V
2
arrojan los resultados deseados.
Supongamos sin embargo, que los resultados del Grupo 1 se aparean individualmente
en la forma siguiente:
Investigado 1 7,2 8,5
Investigado 2 7,4 8,0
Investigado 3 8,7 7,1
Investigado 4 8,5 7,2
Esto es, que los investigados que originalmente tuvieron un buen tiempo lo
empeoraron, aunque los que tuvieron uno malo, lo mejoraron. Es claro que no
debemos concluir en este caso, que la preparación experimental es mejor que la
tradicional, aunque los resultados globales sean mejores (son los mismos, apareados
de forma diferente).
Por esta razón, las comparaciones H
1
y H
2
no son superfluas. Ellas verifican la
tendencia individual de los cambios y justifican además la necesidad de registrar los
resultados individuales de cada investigado antes y después de la preparación. Si no
se tiene conciencia de este hecho al inicio del experimento y se registran solamente
los datos globales no apareados, habremos perdido una información valiosa a nivel
individual que impide hacer el procesamiento estadístico correcto.
En el ejemplo concreto que nos ocupa es de esperar que las comparaciones H
1
y H
2
arrojen ambas cambios significativos. De hecho, la preparación tradicional para educar
capacidades motrices, en particular la rapidez, debe ser capaz también de mejorar los
resultados de la prueba inicial; pero es deseable que quede demostrado que el cambio
antes-después es más marcado en el grupo experimental y sobre todo que esté bien
marcado en la orientación deseada.
Selección de Lecturas de Análisis de Datos en la Cultura Física
36
El esquema de comparación descrito anteriormente se aplica de manera general a
muchas investigaciones similares aunque los resultados esperados en cada
comparación puedan ser diferentes en dependencia de las características propias del
p
roblema.
Supongamos, por ejemplo que se realiza una investigación sobre el papel de la clase
de educación física en la compensación y corrección de los defectos que presentan los
niños con retardo en el desarrollo psíquico a través del uso de métodos,
procedimientos y medios adecuados, así como el análisis de la influencia en el
desarrollo de capacidades intelectuales de otras asignaturas. Se nos plantea medir la
eficiencia de esos métodos, procedimientos y medios de enseñanza comparándolos
con un grupo de niños sanos tomados como control.
En este problema se espera en V
1
diferencias significativas y se aspira a encontrar en
V
2
diferencias no significativas, o al menos no tan marcadas. Las comparaciones
horizontales H
1
y H
2
pueden reflejar cambios si el experimento se realiza por ejemplo,
a lo largo de un tiempo suficientemente grande, pero los cambios reflejados por H
1
deben ser más notables que los de H
2.
Tales resultados evidenciarían que nuestros
procedimientos, métodos y medios empleados especialmente para niños retrasados
en su desarrollo psíquico ayuda a “igualarlos” con los sanos.
Por su grado de generalidad denominaremos a este grupo de pruebas esquema
general de comparación de poblaciones. Las comparaciones verticales reciben
también el nombre de cortes transversales, pruebas de muestras independientes o
comparaciones de primera vía. Las comparaciones horizontales reciben también los
nombres de estudios longitudinales, pruebas de antes-después, pruebas de muestras
relacionadas o comparaciones de segunda a.
Comenzaremos ahora analizando los tests paramétricos para realizar estas
comparaciones, esto es, los tests basados en la hipótesis de que la variable es
continua y tiene distribución normal. Después analizaremos las alternativas no
paramétricas de estos tests.
Normalmente los tests paramétricos son más potentes que sus alternativas no
paramétricas y este hecho explica por qué se procesan los tiempos realizados por los
investigados y no los niveles alcanzados individualmente de acuerdo al resultado de la
prueba realizada como es usual.
De esta forma, nuestra variable a medir, es una variable aleatoria continua y tenemos
la idea que se ajuste a una distribución normal. Ello nos permitirá utilizar los criterios
paramétricos de comparación. En última instancia, a partir de los tiempos registrados,
podremos siempre construir una calificación cualitativa, pero lo inverso no es factible.
Por tanto, en este análisis, como en la mayoría de los análisis estadísticos hay que
procurar las variables a medir y comparar con el más alto nivel de medición posible.
Test de Student y Fischer para comparar variables independientes con
distribución Normal. Test de Student para comparar variables apareadas.
Supongamos X
1
y X
2
sean variables aleatorias independientes con distribución normal,
tales que:
X
1
se distribuye normal con media µ
1
y varianza
2
1
y (1)
X
2
se distribuye normal con media µ
2
y varianza
2
2
.
La comparación de las distribuciones de estas variables requiere de la comparación de
sus medias y de sus varianzas por ello estamos interesados en formular tests para
verificar:
Selección de Lecturas de Análisis de Datos en la Cultura Física
37
-
La igualdad de las medias (H
0
: µ
1
= µ
2
)
.
- La igualdad de las varianzas (H
0
:
2
1
=
2
2
).
En cualquiera de estos casos la hipótesis alternativa podrá ser la desigualdad para
formar un test de dos colas o una desigualdad para formar test de una cola.
Como siempre, esta verificación se hará a partir de los datos de una muestra.
Supongamos por tanto que tenemos una muestra de tamaño n
1
de X
1
con media
1
x y
varianza
2
1
s y una muestra de tamaño n
2
de X
2
con una media
2
x y varianza
2
2
s .
Comparación de varianzas
La prueba de hipótesis más conocida para comparar las medias, depende de si las
varianzas son o no iguales. Por ello comencemos hablando del test para la
comparación de varianzas, donde las hipótesis quedan planteadas de la siguiente
manera:
H
0
:
2
1
=
2
2
(las varianzas no difieren significativamente)
H
1
:
2
1
>
2
2
(la varianza de X
1
es superior a la varianza de X
2
)
Para esta prueba de hipótesis se utiliza el test de Levene, cuyo estadístico de prueba
F proporciona el criterio de decisión. Si el valor del estadístico de prueba que se
obtiene con los valores muestrales tiene una significación
= Prob (Rechazar H
o
con el estadígrafo seleccionado cuando H
o
es cierta)
y es menor que un
0
prefijado (por ejemplo
0
= 0,05), rechazamos la hipótesis
fundamental con un nivel de significación
0
. Rechazar H
0
equivale a decir que las
varianzas difieren significativamente. Aceptar H
0
(cuando
0
) equivale a decir que
no tenemos razones suficientes para pensar que las varianzas sean diferentes.
En los paquetes (programas automatizados) de procesamiento estadístico modernos
se brinda el valor del estadístico de prueba para la muestra y su significación . La
conclusión del test se extrae comparando a con 0,05 u otro valor
0
prefijado.
Test de Student para muestras independientes
Formularemos ahora dos pruebas de hipótesis para comparar las medias, en
dependencia de si las varianzas
2
1
y
2
2
son iguales o no.
Si las varianzas
2
1
y
2
2
son diferentes, la comparación de las medias se hace con el
estadístico:
2
2
2
1
2
1
21
n
s
n
s
xx
T
+
=
que tiene una distribución t de Student con
1
1
1
1
22
2
+
+
+
+
=
2
2
2
2
1
1
2
1
2
2
2
1
2
1
n
n
s
n
n
s
n
s
n
s
gl
.
Si las varianzas
2
1
y
2
2
son iguales, la comparación de las medias se hace con el
estadístico:
Selección de Lecturas de Análisis de Datos en la Cultura Física
38
2
2
p
1
2
p
2
1
n
s
n
s
xx
T
+
=
que se distribuye t de Student con n
1+
n
2
- 2 grados de libertad,
donde s
p
es una estimación conjunta de la varianza común a partir del total de la
muestra:
21
2
22
2
11
2
p
nn
1)sn(1)s(n
s
+
+
=
.
La hipótesis nula es:
H
0
: µ
1
= µ
2
(No existen diferencias significativas entre las medias de ambas
poblaciones).
La hipótesis alternativa, está en dependencia de lo que deseamos verificar, es decir,
en el caso que deseemos verificar que existen diferencias significativas entre las
medias de ambas poblaciones o que una de las medias es superior a la otra, tenemos
las siguientes posibilidades:
H
1
; µ
1
_ µ
2
H
1
; µ
1
> µ
2
H
1
; µ
1
< µ
2
Test de dos colas tests de una cola
Las conclusiones se extraen de forma análoga a como se procedió con la varianza.
En resumen, para comparar dos variables independientes, con distribución normal,
debemos seguir el procedimiento siguiente:
1ro. Comparamos sus varianzas utilizando el test de Levene. Sacamos conclusiones
sobre si la varianza de ellas es o no similar y decidimos como proceder a
continuación con las medias.
2do. Si encontramos diferencias significativas al aplicar el test de Levene, es decir,
existen diferencias significativas entre las varianzas, comparamos las medias con
el test t de Student correspondiente a varianzas diferentes (varianzas separadas)
y sacamos conclusiones sobre la igualdad de las medias.
3ro. Si en el primer paso no encontramos diferencias significativas entre las varianzas,
comparamos las medias con el test t de Student correspondiente a varianzas
iguales (varianzas conjuntas) y sacamos así las conclusiones sobre la igualdad
de las medias.
Usar el t de Student para varianzas conjuntas cuando las varianzas son realmente
diferentes puede conducir a errores notables. Usar el test de varianza separada
cuando las varianzas son iguales resultaría en un nivel de significación algo más
grande de lo que debe ser; pero en todo caso esto es preferible. En otras palabras si
existiera duda sobre si las varianzas son iguales o no, es mejor utilizar el test de
varianzas separadas.
En el SPSS/PC, el test de Levene y los dos tests de Student se ejecutan
automáticamente, y se deja a la persona que realiza el procesamiento que seleccione
el test de Student que debe fundamentar sus conclusiones en dependencia del test de
Levene.
Ilustraremos una salida del SPSS para la comparación de los dos grupos en la primera
prueba en el ejemplo dado.
Selección de Lecturas de Análisis de Datos en la Cultura Física
39
T-Test
Group Statistics
GRUPO
N Mean Std. Deviation Std. Error Mean
1 50 8,1480 ,982 ,139 Prueba 1
2 50 8,0540 ,964 ,136
Independent Samples Test
Levene's Test for
Equality of Variances
t-test for Equality of Means
F Sig. t df Sig. (2-tailed)
Equal Variances assumed -48 98 ,630
Equal variances not assumed
1,04 ,895
-48 97,96
,630
Además de los estadísticos descriptivos fundamentales, la salida muestra una tabla
dividida en dos partes en el que se muestra el estadístico F con su significación y en
filas diferentes los tests de Student, para varianzas iguales y varianzas diferentes.
Hemos seleccionado la parte de la salida que muestra el resultado de los tres tests
involucrados en el análisis.
En este ejemplo, la significación de la F de Levene es 0,895 > 0,05, lo que nos dice
que la varianza de la prueba inicial es la misma en ambos grupos y nos sugiere
además que utilicemos el test de Student con varianza conjunta, entonces como la
significación de este test es 0,630 > 0,05, concluimos que los resultados medios de las
pruebas iniciales son los mismos en ambos grupos. En resumen en el momento inicial,
los resultados de la prueba rapidez son similares entre ambos grupos desde el punto
de vista de su valor promedio y su varianza, o en otras palabras, el grupo experimental
y el de control están bien seleccionados porque son homogéneos inicialmente.
Estamos asumiendo que antes de aplicar los tests anteriores verificamos
efectivamente que los resultados de la Prueba 1 (caso mostrado) en cada uno de los
grupos se ajustan a una distribución normal.
Test de Student para muestras apareadas
Formularemos ahora una prueba de hipótesis para la comparación horizontal. Sean X
1
y X
2
variables aleatorias con distribución normal y apareadas; más precisamente (X
1
,
X
2
), es un par de variables aleatorias con distribución conjunta normal divariada.
Supongamos que ellas no son independientes y que tenemos una muestra de este
par, esto es, un conjunto n de pares de datos. El test para comparar sus valores
medios se basa en el cálculo previo de la diferencia entre ambas variables para cada
sujeto de la muestra:
D = X
1
X
2
La media de esta variable es
21
XXD = ; pero su varianza no es la suma de las
varianzas, por no ser estas variables independientes. De hecho la varianza de D
depende de las varianzas de X
1
y X
2
y del coeficiente de correlación lineal entre las
dos.
El estadígrafo para formular el test es el siguiente:
n
S
D
T
D
=
donde
2
D
S es la varianza corregida de la diferencia, como D tiene distribución normal,
si la hipótesis fundamental de igualdad de las medias es cierta, el estadígrafo T tiene
también la distribución de Student con n-1 grados de libertad y su valor no es
probablemente muy diferente de cero.
Selección de Lecturas de Análisis de Datos en la Cultura Física
40
Entonces, como siempre, si en la muestra obtenemos un valor del estadístico de
prueba significativamente grande, rechazamos la hipótesis fundamental. Veamos una
salida de resultados:
T-Test
Paired Samples Statistics
Mean
N Std. Deviation Std. Error Mean
Prueba1 8,1694 49 ,980 ,140
Pair 1
Prueba2 7,3091 49 ,847 ,121
Paired Samples Correlations
N Correlation Sig.
Pair 1 Prueba1 & Prueba2 98 ,925 ,000
Paired Samples Test
Paired Differences
Mean Std. Deviation Std. Error Mean
t df
Sig. (2-
tailed)
Pair 1 Prueba 1 – Prueba 2 ,8653 ,377 ,054 16,06 48 ,000
Observe que la salida difiere un tanto de las anteriores, aquí se reflejan tres salidas:
las medidas descriptivas de forma independiente de cada una de las pruebas, el
coeficiente de correlación con su significación (esperada menor que 0,05) y al final, las
medidas descriptivas de la diferencia D ( D = Prueba 1- Prueba 2, por eso es positivo)
en la parte izquierda y en la parte derecha el valor del estadígrafo de prueba T, con
sus grados de libertad y significación. Es evidente que el Grupo 1 mejoró
significativamente y positivamente.
En las pruebas apareadas, estamos suponiendo también que previamente
demostramos la normalidad de las variables. Hay un detalle interesante que puede ser
importante en el orden práctico. Este último test no depende tanto de si X
1
y X
2
son
distribuidas normalmente como que la diferencia lo sea. Por tanto aún en casos en que
las variables originales no se distribuyan normalmente, pero su diferencia sí, el test de
Student para muestras apareadas es aplicable.
Por lo que para proceder a aplicar el test de Student para muestras apareadas, es
necesario primero verificar si la variable diferencia se distribuye normalmente.
Alternativas no paramétricas de comparación. Transversal y longitudinal. Los
tests de Mann-Whitney y Wilcoxon.
Supongamos ahora que las variables originales son continuas, pero no tienen
distribución normal o supongamos incluso que son ordinales. ¿Con qué tests
estadísticos podemos dar respuesta al esquema general de comparación?.
Para tener ejemplos concretos podemos suponer que al probar normalidad en la
prueba de rapidez, el test de Kolmogorov- Smirnov determinó que alguno o varios de
los tiempos realizados por los alumnos de los grupos no se ajustaba significativamente
de la distribución normal. En tal caso el análisis anterior no será válido.
Otro problema con mucho sentido podría ser el siguiente: aun suponiendo que las
variables originales se ajustaran a una distribución normal y que ya hallamos obtenido
los resultados anteriores, es de interés determinar hasta qué punto estas diferencias
significativas se aprecian en las calificaciones cualitativas.
En efecto, podría muy bien ocurrir que la nueva metodología para educar la rapidez
como capacidad motriz produjera resultados significativamente mejores
cuantitativamente, pero estos cambios no ser tan marcados como para determinar
mejoras cualitativas (en términos de categorías de NIVEL I, NIVEL II, NIVEL III,
NIVEL IV, SIN NIVEL).
Selección de Lecturas de Análisis de Datos en la Cultura Física
41
Para emprender este análisis adicional, recodificamos las variables Prueba 1 y Prueba
2 por rangos hasta conseguir valores discretos ordinales:
1
Nivel I
2
Nivel II
3
Nivel III
4
Nivel IV
5
Sin nivel
y nos preguntamos ahora cómo hacer las comparaciones horizontales y verticales de
este esquema.
Existen varios tests no paramétricos (que no suponen nada acerca de la distribución
de las variables) para comparar las distribuciones en grupos independientes o en
momentos diferentes. Se dice que tales tests son alternativas no paramétricas de los
tests paramétricos de Student. Estos tests trabajan con variables ordinales o en
particular dicotómicas, porque su esencia es ranquear los valores de las variables.
La alternativa no paramétrica más generalmente usada del test de Student para la
comparación de muestras independientes es el test de Mann-Whitney (o también test
de suma de rangos de Wilcoxon). La alternativa no paramétrica más universal del test
de Student para muestras apareadas es el test de rangos señalados de Wilcoxon
(denominado también test de Wilcoxon de antes-después). Expliquemos en esencia en
qué consiste cada uno.
Test de Mann-Whitney o de suma de rangos de Wilcoxon
Sean X
1
y X
2
variables ordinales independientes con distribución cualquiera
desconocida. Supongamos que queremos verificar la hipótesis de que sus dos
distribuciones son coincidentes, en el sentido de que los rangos de los valores que
aparecen en las respectivas muestras no difieran significativamente.
El test se basa en el ranqueo de los datos de la muestra total (compuesta de los dos
grupos) y la observación de si estos valores ranqueados de un grupo y el otro se
intercalan adecuadamente como una medida de que las distribuciones no difieren.
Supongamos, por ejemplo que estamos midiendo si el tiempo de trabajo sin fallos de
dos máquinas tiene la misma distribución sin poder precisar a priori cuál es esta y
tenemos un conjunto de observaciones del tiempo de trabajo sin fallos de cada una de
las dos máquinas. Para simplificar supondremos que son tres observaciones de cada
una de las formas siguientes:
Máquina
Tiempo de trabajo sin fallos Rango asignados
1 199 6
1 126 5
1 81 2
2 68 1
2 115 3.5
2 115 3.5
Observe a la derecha como se asignan los rangos a la muestra conjunta desde el
menor valor al mayor y como se trataron las ligaduras (se les dio el promedio de los
rangos que le correspondían al total de las observaciones ligadas).
El criterio de Mann-Whitney parte de determinar el número de veces que un valor del
grupo más pequeño precede a un valor del grupo más grande. Si los tamaños de las
muestras son iguales, como en nuestro ejemplo, analiza las dos orientaciones y toma
la menor.
Selección de Lecturas de Análisis de Datos en la Cultura Física
42
O
rden de las máquinas según el rango
2
1
2
2
1
1
En el ejemplo hay solo dos veces que los valores de la máquina 1 tiene rangos
menores a los rangos de los valores de la máquina 2 (concretamente la primera
observación de la primera máquina precede a la segunda y tercera observación de la
segunda máquina). Desde el punto de vista inverso hay 7 veces en los cuales valores
de rango de la máquina 2 tienen rangos menores que valores de la máquina 1.
Mann-Whitney construye el estadístico U como el número mínimo de estas dos
determinaciones (2 y 7) que en este caso es 2 si las distribución de las variables son
iguales el estadístico U no debe ser demasiado grande.
Para muestras pequeñas se puede determinar la distribución del estadígrafo U
condicionada a la hipótesis fundamental y construir un test con probabilidad exacta.
Para muestras grandes, a partir de U se construye el estadígrafo:
12
1)nn(nn
2
nn
U
z
2121
21
++
=
donde n
1
es el tamaño de la muestra más pequeña y n
2
es el de la más grande y se
demuestra que Z tiene aproximadamente distribución normal.
El criterio de la suma de rangos de Wilcoxon consiste en calcular la suma W de los
rangos para el grupo de menor tamaño de muestra (o para el primer grupo, si las
muestras tiene igual tamaño), si la hipótesis fundamental es cierta, esta suma W
debería ser aproximadamente la mitad de la suma total de los rangos en la muestra
completa.
Para muestras pequeñas, la distribución de W se determina con precisión y se puede
construir un test exacto, para muestras grandes se construye el estadístico:
12
)1n(nnn
2
)1n(nn
W
z
2121
211
++
+
+
=
que tiene también aproximadamente distribución normal.
Se muestra que ambos criterios conducen a la misma significación y por ello se habla
indistintamente del test de rangos de Mann-Whitney o el test de suma de rangos de
Wilcoxon. La mayoría de los paquetes estadísticos lo conocen como el test de Mann-
Whitney para distinguirlo del test de Wilcoxon para muestras relacionadas.
A manera de ejemplo veamos el resultado de la comparación de la PRUEBA1 en
categorías cualitativas (1, 2, 3, 4 y 5)
Selección de Lecturas de Análisis de Datos en la Cultura Física
43
Mann-Whitney Test
Ranks
GRUPO N Mean Rank
EXPERIMENTAL 50 49,31 PRUEBA 1
CONTROL 50 51,69
Total 192
Test Statistics
a
PRUEBA1
Mann-Whitney U 1,190
Wilcoxon W 2465,5
Z -,462
Asymp. Sig. (2-tailed) ,6698
a Grouping Variable: GRUPO
La salida del SPSS refleja como estadística descriptiva, el rango medio de cada grupo,
el valor del estadístico U de Mann - Whitney, el valor de la suma de los rangos W
de Wilcoxon y en el caso de muestras grandes como estas, el valor de la Z común y
su significación. En caso de muestras pequeñas se conforma el test exacto y se da
la significación también. En fin atendiendo a que la significación de este test es
0,6698 > 0,05, concluimos que las evaluaciones de la prueba inicial no difieren
cualitativamente entre los dos grupos.
Test de Wilcoxon para muestras apareadas
Supongamos que X
1
y X
2
conforman un par de variables aleatorias cuya distribución
conjunta es desconocida y tenemos una muestra de n pares. Pretendemos analizar si
la distribución de X
1
y X
2
coincide en el sentido de que no haya predominio de
incrementos ni reducciones en la diferencia X
1
X
2
.
Para verificar esta hipótesis, Wilcoxon propone calcular las diferencias por pares y
ranquearlas en conjunto. Si la hipótesis fundamental es cierta, el número y magnitud
de veces que X
1
es mayor que X
2
no debe diferir mucho del número y magnitud de
veces que ocurre lo contrario y las diferencias ranqueadas deben equilibrarse.
Wilcoxon reduce estas determinaciones a un estadígrafo Z que tiene, para muestras
de tamaño bastante grande distribución normal estandarizada.
Veamos el ejemplo de la comparación horizontal H
1
(dentro del grupo experimental)
entre la prueba inicial y final.
Wilcoxon Signed Ranks Test
Ranks
N Mean Rank
Negative Ranks 36
a
18,50
Positive Ranks 0
b
0
Ties 13
c
Prueba2 - Prueba1
Total 49
a prueba2 < prueba1
b prueba2 > prueba1
c prueba1 = prueba2
Test Statistics
b
tiempo2 - tiempo1
Z -5,2316
a
Asymp. Sig. (2-tailed) ,000
a Based on positive ranks.
b Wilcoxon Signed Ranks Test
Selección de Lecturas de Análisis de Datos en la Cultura Física
44
La Z es altamente significativa como consecuencia del hecho que hay un predominio
de casos en los cuales la prueba final supera la inicial.
A
modo de conclusiones
El esquema de comparación de poblaciones que hemos presentado aquí es aplicable
a muchas investigaciones en las que tenemos típicamente un grupo experimental y un
grupo de control y una medición antes y después.
Será generalizado en el apartado siguiente al caso en que tengamos más de dos
grupos o más de dos momentos para comparar.
Las pruebas de Levene y Student son los tests estadísticos clásicos para resolver el
esquema en el caso en que las variables sean distribuidas normalmente; pero además
tenemos alternativas no paramétricas para estos tests, entre las cuales, las más
universales son el test de Mann-Whitney y el test de Wilcoxon.
Comparación de más de dos poblaciones. Análisis de varianza unifactorial.
Pruebas de hipótesis paramétricas y no paramétricas.
Se denomina análisis de varianza a las pruebas estadísticas que permiten la
comparación de k poblaciones, con k > 2.
Desde el punto de vista del esquema de comparación de poblaciones planteado
anteriormente, se trata de formular los tests que permiten generalizar el esquema de
comparación de dos poblaciones al caso en que se tiene verticalmente más de dos
grupos independientes, u horizontalmente más de dos momentos.
Visto como una forma particular de dependencia, el análisis de varianza permite
estudiar la dependencia de una variable aleatoria continua u ordinal X respecto a una
variable aleatoria discreta -en principio nominal- que se denomina “factor”. En un
esquema de comparación de más de dos poblaciones, la comparación vertical se logra
con un análisis de varianza de la variable objeto de medición respecto al factor grupo
-con p valores posibles- y la comparación horizontal con un análisis de varianza de la
misma variable respecto al factor momento -con k valores posibles-. El análisis de
varianza vertical recibe también el nombre de análisis transversal, comparación de
poblaciones independientes o análisis de varianza de primera vía. El análisis de
varianza horizontal, se denomina también análisis longitudinal, comparación de
muestras dependientes o análisis de varianza de segunda vía.
Para ubicarnos en un ejemplo rápidamente, pensemos en la aplicación de un nuevo
método para educar las capacidades motrices, en particular la rapidez, descrito en el
apartado anterior y supongamos ahora que se realiza con más de dos grupos,
digamos que es porque se está experimentando más de un método de preparación
física para seleccionar entre estos el más efectivo. Se seleccionan 4 grupos
independientes que van a recibir la preparación por métodos diferentes. Suponga
además que la prueba de rapidez se realiza en más de dos momentos: una inicial, otra
intermedia y una final para detallar la “evolución del aprendizaje”. Concretamente se
va a medir la rapidez al inicio de la preparación, 6 meses después y al cabo de un año.
Esta es una variable continua u ordinal (si se mide en niveles alcanzados). El factor
vertical nominaliza los grupos independientes o distintos tipos de métodos. El factor
horizontal representa los distintos momentos en cada investigado y grupo en que se
realiza la prueba. Por supuesto que el esquema puede tener sus variantes
particulares.
Como ya se sabe, la precisión de “qué es lo que se compara de las variables” depende
no solo de su nivel de medición, sino también de su distribución específica. Si la
variable objeto de medición tiene una distribución normal, se comparan esencialmente
sus valores medios y sus varianzas. Si la variable no tiene distribución normal, pero es
continua o al menos ordinal, se comparan sus rangos medios de valores, o
Selección de Lecturas de Análisis de Datos en la Cultura Física
45
probablemente sus medianas, si este es un parámetro que caracteriza bien la
tendencia central de sus distribuciones. De modo que también en este tipo de pruebas
se tiene un “análisis de varianza clásico o paramétrico” para variables con distribución
n
ormal y alternativas no paramétricas del análisis de varianza.
A continuación precisaremos algunas ideas del análisis de varianza unifactorial
paramétrico.
Hipótesis necesarias
Sean X
1
, X
2
, ... X
p
variables aleatorias normalmente distribuidas e independientes.
Supondremos además que estas variables tienen la misma varianza
H
0
:
22
3
2
2
2
1
...
p
==== (hipótesis de homogeneidad de varianzas).
Se desea docimar:
H
0
: µ
1
= µ
2
= ..... = µ
p
(no hay diferencias entre las medias de los p grupos) y
H
1
: existe un par (i, j), i j, tal que µ
i
µ
j
(al menos las medias de dos grupos difieren)
a partir de los datos de una muestra de tamaño n
i
de cada variable X
i
, i = 1, 2, ..., p.
Nótese en principio que los tamaños n
i
no son necesariamente iguales.
Es importante tener en cuenta que el análisis de varianza paramétrico responde a tres
requisitos fundamentales: la independencia de las variables, la normalidad de las
variables y la homogeneidad de las varianzas.
El requisito de independencia de las variables se logra normalmente con la
independencia de los grupos en el diseño de la investigación. La normalidad se verifica
para la variable objeto de medición en cada uno de los p grupos, mientras que el
requisito relacionado con la homogeneidad de varianzas se verifica utilizando test de
Levene que es una prueba que no depende de la normalidad de los grupos.
Si la hipótesis de homogeneidad de varianzas falla, se debe tener al menos tamaños
similares de muestras. Esto suele llamarse experimento equilibrado. La distribución de
Fischer Snedecor, y por tanto el análisis de varianza, es menos sensible a la violación
de este requisito cuando el diseño es equilibrado.
Cuando fallan las hipótesis de normalidad de las variables o de homogeneidad de sus
varianzas -especialmente si el diseño no es equilibrado-, la comparación de los grupos
independientes debe hacerse con un análisis de varianza no paramétrico.
Un foco de atención del investigador al aplicar el análisis de varianza debe centrarse
en la formulación de las conclusiones. El rechazo de la hipótesis fundamental de un
análisis de varianza paramétrico induce apenas a la conclusión de que no todas las
medias son iguales, es decir, que al menos hay un par de medias diferentes, o que
hay alguna influencia del factor sobre la variable. Sin embargo, no precisa de
antemano si hay un grupo absolutamente “mejor” o “peor”, o si algunos de estos
grupos son homogéneos y se pueden formar dos o más subgrupos, unos mejores que
otros. Para complementar las conclusiones del análisis de varianza, deben hacerse
tests de rangos o contrastes que comparen los grupos por pares para localizar las
diferencias.
Algunos tests de rangos son los siguientes:
Test de Diferencias Honestamente Significativas
Test Modificado de Mínimas Diferencias Significativas
Test de Diferencias Honestamente Significativas de Tukey
Test de Student-Newman-Keuls
Test Alternativo de Tukey
Tests de Duncan
Test de Scheffé
Selección de Lecturas de Análisis de Datos en la Cultura Física
46
De estos los más populares son el test de Duncan y el test de Scheffé. El primero
parte del ranqueo de las medias de grupo de la más pequeña a la mayor y usa la
distancia o número de pasos entre dos medias como parte del valor del rango; Esto lo
l
ogra de manera que mientras más grande es el número de grupos a comparar, más
difícilmente se obtienen diferencias significativas. El segundo es conservador en las
comparaciones y encuentra las diferencias significativas si son muy marcadas.
La aplicación de los tests de rangos cuando los grupos que se comparan son
similares -diseños equilibrados- ayuda a formar grupos homogéneos, es decir,
subconjuntos de la familia de grupos independientes que tienen medias similares.
Cuando se procesan los datos correspondientes a un problema cuya solución requiere
el uso del análisis de varianza, la mayoría de los paquetes estadístico dan
directamente el nivel de significación del estadígrafo de prueba calculado. Como
siempre, la condición de rechazo es <
0
.
Ilustraremos la interpretación de resultados mediante una salida del SPSS para el
ejemplo dado en este apartado.
ANOVA de un factor
Prueba de homogeneidad de varianzas
Prueba 3
Estadístico de Levene
gl1 gl2 Sig.
,3667 3 195 ,625
ANOVA
Prueba 3
Suma de cuadrados gl Media cuadrática F Sig.
Inter-grupos 21,1726 3 7,0575 14, 9462 ,0000
Intra-grupos 92,0782 195 0,4722
Total 113,2508 198
La salida del SPSS nos muestra el resultados del test de homogeneidad de
varianzas para el caso de la prueba de rapidez antes de la preparación. Como la
significación del test es mayor que el nivel de significación no se rechaza la hipótesis
de nulidad, podemos asumir que existe homogeneidad de varianzas ( >
0
, es decir
0,625 > 0,05).
El ANOVA de un Factor nos muestra que <
0
(0.0000 < 0.01) por tanto, se
rechaza H
0
que equivale a decir que no todas las medias son iguales, esto es, el
tiempo promedio realizado en la tercera prueba de rapidez por los investigados no son
iguales entre los grupos, hay una dependencia respecto al método de preparación
que reciben.
Ya se dijo que cuando fallan las hipótesis de normalidad de las variables o de
homogeneidad de sus varianzas -especialmente si el diseño no es equilibrado-, la
comparación de los grupos independientes debe hacerse con un análisis de varianza
no paramétrico. Entre las alternativas no paramétricas se utiliza frecuentemente el test
de Kruskal-Wallis. Este exige que la variable a comparar tenga, al menos, nivel de
medición ordinal y constituye la extensión natural del test de Mann-Whitney para la
comparación de dos grupos.
El test de Kruskall-Wallis verifica la hipótesis fundamental de igualdad de
distribución de las variables en los p grupos. Para ello se asignan rangos a los
valores de las variables en toda la población como lo realiza el test de Mann-Whitney.
Luego se examina si los rangos de estas variables se intercalan adecuadamente entre
los grupos. El test de Kruskal-Wallis no tiene asociado un test de rango específico,
Selección de Lecturas de Análisis de Datos en la Cultura Física
47
pero como tal se puede utilizar el test de Mann-Whitney con exigencias más alta
para la significación. He aquí una salida ejemplo del SPSS.
Prueba de Kruskal-Wallis
Rangos
GRUPO
N Rango promedio
1 49 102,53
2 50 122,14
3 50 114,97
4 50 60,41
PRUEBA 3
Total 199
Estadísticos de contraste
a b
PRUEBA3
Chi-cuadrado 34,4913
gl 3
Sig. asintót. ,000
a Prueba de Kruskal-Wallis
b Variable de agrupación: GRUPO
Como <
0
(0.0000 < 0.01) se rechaza H
0
que equivale a decir que no hay igualdad
en la distribución de los rangos medios de la variable prueba 3 entre los grupos, esto
es, el rango medio de los tiempos realizados en la tercera prueba de rapidez por los
investigados no son iguales entre los grupos, hay una dependencia respecto al
método de preparación que reciben.
La instrumentación de un análisis de varianza paramétrico de comparación horizontal
no es tan fácil. Existe, en cambio, un análisis de varianza horizontal no paramétrico -
Test de Friedman- que puede utilizarse para cualquier variable con nivel de medición
al menos ordinal y, en particular, para variables aleatorias continuas con o sin
distribución normal. Este test de Friedman ranquea para cada caso los valores de la
variable en los k momentos con valores enteros de 1 a k y luego compara estos
órdenes a nivel de grupo.
Como test de rangos se puede utilizar el test de Wilcoxon de comparación de dos
muestras apareadas.
Para el caso particular de variables dicotómicas se tiene el Test Q de Cochran, que
constituye la generalización natural del test de Mc Nemar a k proporciones de
muestras apareadas.
Una salida de resultados del SPSS para una comparación horizontal de tres pruebas
para uno de los grupos específicos del ejemplo ya expuesto mediante el test de
Friedman es el siguiente:
Prueba de Friedman
Rangos
Rango promedio
Prueba 1 3,00
Prueba 2 1,97
Prueba 3 1,03
Estadísticos de contraste
N 48
Chi-cuadrado 93,0938
gl 2
Sig. asintót. ,000
a Prueba de Friedman
Selección de Lecturas de Análisis de Datos en la Cultura Física
48
Como <
0
(0.000 < 0.01) se rechaza H
0
que equivale a decir que hay cambios
significativos en los tiempos realizados en la prueba de rapidez en los diferentes
momentos, hay una dependencia respecto al momento que realizan la prueba.
Algunos ejemplos de aplicación del análisis de varianza unifactorial.
Comparación de una característica "X" entre grupos de sujetos, donde los grupos
pueden estar determinados por equipos deportivos, posición de juego dentro de un
equipo, grupos de edades, etc.
Comparación de varios regímenes de entrenamiento para determinar si conducen
a distintos resultados.
Comparación de varios recuperantes a través del efecto que producen.
Estudio longitudinal de la composición corporal de atletas de un determinado
deporte durante su preparación deportiva.
De manera resumida se muestran algunos tests que pueden aplicarse en un esquema
de comparación de más de dos poblaciones son:
Condiciones del test Test Test de rangos
Variable continua normal. Más de
dos grupos independientes
Análisis de varianza
unifactorial (ONE WAY)
Duncan, Scheffé,...
Variable continua no normal o
variable discreta ordinal. Más de
dos grupos independientes
Análisis de varianza l no
paramétrico de Kruskal-
Wallis
Test U de Mann-Whitney
con exigencias más altas
para la significación
Variable continua u ordinal. Más de
2 grupos o situaciones apareadas
Análisis de varianza no
paramétrico de Friedman
Test de Wilcoxon con
exigencias más altas para
la significación
Variable nominal dicotómica. Más
de dos grupos independientes
Tabla de contingencia de
dimensión 2xp (p>2)
Tablas de contingencia
2x2
Variable nominal dicotómica. Más
de dos momentos o situaciones
apareadas
Test Q de Cochran
Test de Mc Nemar con
exigencias más altas para
la significación
Note que la orientación vertical u horizontal de la comparación y el número de grupos
y/o de momentos son elementos importantes que intervienen en la decisión de qué
test se utiliza para procesar estadísticamente sus datos.
Algunos ejercicios para la reflexión
1. Se investiga la influencia que el aprendizaje elemental del juego de ajedrez ejerce
en el desarrollo de la flexibilidad del pensamiento de niños de grado de preescolar.
Para el logro de este objetivo se aplica una metódica diagnóstica de la flexibilidad
mental. Se aplica la metódica antes de iniciar el experimento y se conforman los
grupos, uno de control y otro experimental, al grupo experimental se le aplica un
sistema de tareas experimentales formativas para el aprendizaje de situaciones
relacionadas con la enseñanza del ajedrez y al final del experimento se mide otra
vez la flexibilidad del pensamiento infantil.
El investigador comprueba que el grupo experimental alcanza un desarrollo de la
flexibilidad mental significativamente superior al que logra el grupo de control y se
confirma por tanto la utilidad de formar en los niños la habilidad para jugar ajedrez.
a) ¿Para qué se debe comparar la flexibilidad mental entre los dos grupos de
niños antes de iniciar el experimento? ¿Qué test se utilizaría?
b) ¿Qué reflejaría la comparación de la flexibilidad al final del experimento entre
los dos grupos de niños? ¿Qué test se utilizaría?
Selección de Lecturas de Análisis de Datos en la Cultura Física
49
c) ¿Por qué debemos comparar en cada grupo la flexibilidad mental al inicio y al
final del experimento? ¿Podemos prescindir en este ejemplo de esa
comparación? Si la hacemos ¿qué test se utilizaría?
d) ¿Qué haría usted si algunos niños dejan de asistir a la escuela por razones de
salud después de iniciar el experimento? ¿Cómo esto repercutiría en cada uno
de los análisis anteriores? ¿Podría incluirse en el análisis estadístico algún
niño cuya medición de la flexibilidad antes de iniciar el experimento hubiese
sido omitida?.
2. ¿Cómo diseñaría el experimento mediante un esquema de comparación de dos
poblaciones (total o parcial) en cada uno de los problemas que se presentan a
continuación?
Un entrenador pretende aplicar a un grupo de boxeadores un sistema de
ejercicios especiales que permitan la conservación y recuperación del
equilibrio, bajo el efecto de golpes en la cabeza. Tiene en mente la siguiente
hipótesis “la aplicación sistemática y progresiva de ejercicios especiales para
desarrollar la capacidad de trabajo del aparato vestibular influye positivamente
sobre la conservación y recuperación del equilibrio de los boxeadores bajo el
efecto de golpes en la cabeza ¨
Se desea conocer cómo se comporta el rendimiento motor entre niños que
practican sistemáticamente un deporte y aquellos que solo están sometidos a
la práctica de actividades físicas programadas en sus clases de Educación
Física.
3. Para cada uno de los siguientes problemas analice las respuestas de las
interrogantes que se formulan:
a. ¿Es necesario hacer comparaciones horizontales?.
b. ¿Es necesario hacer comparaciones verticales?.
c. ¿Cuál es el nivel de medición de la variable en estudio?.
d. ¿Es posible aplicar una dócima paramétrica?. Explique.
e. ¿Cuál seria la dócima adecuada a emplear para dar solución al problema
planteado?.
Seleccionada la dócima:
Formule la hipótesis estadística a verificar.
¿Cómo verificaría estadísticamente estas hipótesis?. Explique.
Si se rechaza la hipótesis fundamental ¿cómo podrá complementar las
conclusiones del análisis de varianza?.
PROBLEMA 1
En un archivo se tienen los datos de las pruebas relacionadas con las habilidades
investigativas, aplicadas a alumnos de la carrera licenciatura en Cultura Física que
recibieron la asignatura Metodología de la Investigación, proceden de tres Centros
diferentes de la Red del Instituto Superior de Cultura Física ¨Manuel Fajardo¨ y a los
mismos se le realizaron tres controles durante el todo el período de duración de la
carrera.
Se quiere:
Determinar cuáles de las pruebas aplicadas antes de recibir la asignatura
distinguen a los alumnos de las tres centros.
Determinar cuáles de las pruebas aplicadas al final del último semestre
distinguen los alumnos de las tres centros.
Selección de Lecturas de Análisis de Datos en la Cultura Física
50
Comparar los resultados de las pruebas de los tres controles realizados para
t
ener una medida de los avances que obtienen los alumnos.
PROBLEMA 2.
Un archivo contiene los datos de la talla de 73 jugadoras de basquetbol (30 defensas,
21 delanteros y 22 centros). Se quiere comprobar la talla promedio por posiciones y
extraer conclusiones al respecto.
Selección de Lecturas de Análisis de Datos en la Cultura Física
51
Medida de relación
MSc. Ramón S. Folgueira Roque
Correlación
Si se hace una fila de menor a mayor en un grupo de personas es probable que las
mismas queden ordenadas también por su peso, o al menos se observa una tendencia
en el sentido de que este va aumentando, con algunas variaciones, entonces se puede
decir sin temor a equivocarse que la talla y el peso están relacionadas
estadísticamente. Esta relación no es causal, o sea, un aumento de talla no indica un
aumento obligatorio de peso, sino que es producida por factores de carácter genético
que determinan esta relación y que por la acciones de otros factores (tipo de
alimentación, práctica de ejercicios físicos, etc.), no comunes a estas variables, se
producen cambios por separado en cada una de ellas que no determinan la relación
causal. Dicha relación puede ser de mayor o menor grado, y al valor numérico de la
misma se le llama correlación.
Correlación: es el grado de relación entre dos o más variables
y es producto de los factores comunes a ellas.
Cuando se procesan los datos de una batería de rendimiento motor es de esperar que
existan valores numéricos aceptables de las correlaciones entre las pruebas que
conforman dicha batería, estas correlaciones, que indican la relación entre las
pruebas, son producto de la educación de las capacidades motrices en los sujetos
investigados. Ahora bien, los valores numéricos obtenidos de las correlaciones no
explican qué factores son los que están actuando, para ello el investigador debe
interpretar, a partir de sus conocimientos y experiencia, cuáles son esos factores.
La correlación tiene magnitud y signo, la magnitud varía entre cero (0) y uno (1),
mientras más cerca de uno hay entonces una mayor relación entre las variables y
mientras más cerca de cero es menor su relación, al menos del tipo de relación que se
está calculando. Zatsiorski (1989) y Brogli (1977) proponen diferentes escalas para
evaluar la relación entre las variables según la magnitud de la correlación (tabla 1),
aunque muy parecidas.
Tabla 1: Relación entre variables según la magnitud de la correlación
Según Zatsiorski Según Brogli
Magnitud Relación Magnitud Relación
0,00 No hay 0,00 No hay
de 0,0 a 0,19 Muy débil Hasta 0,3 Débil
de 0,2 a 0,49 Débil de 0,3 a 0,5 Moderada
de 0,5 a 0,69 Media de 0,5 a 0,7 Considerable
de 0,7 a 0,99 Fuerte de 0,7 a 0,9 Fuerte
1,00 Funcional Más de 0,9 Muy Fuerte
1,00 Funcional
Entonces la magnitud indica la fuerza de la relación entre las variables y el signo es el
sentido de la relación. Una correlación positiva indica que la tendencia de la relación
es que ambas variables aumenten (disminuyan) por la acción de los factores comunes
y cuando el signo es negativo entonces, por la acción de estos factores una tiende a
aumentar y la otra a disminuir. Algunos autores interpretan el signo positivo como una
relación directa y el negativo como una relación inversa. En matemáticas, la relación
directa está asociada a la línea recta y la relación inversa a que el producto de las
variables es igual a una constante, por eso el autor prefiere no utilizar las
denominaciones de directa e inversa.
Selección de Lecturas de Análisis de Datos en la Cultura Física
52
Si dos variables son estadísticamente independientes entonces cualquier tipo de
correlación calculada entre ellas es cero. Tenga en cuenta que la dependencia
estadística entre variables no indica influencia de una en la otra, sino la dependencia
d
e factores comunes.
Diagrama de dispersión
En el gráfico 1 se muestra el diagrama de dispersión (en inglés scatterplot) de la talla
con el peso, cada punto representa un sujeto del grupo a los cuales se les han hecho
estas mediciones, se ha situado la talla en el eje X y el peso en el eje Y. Observe que
hay una tendencia a que ambas aumenten, entonces la talla y el peso están
relacionadas positivamente. En este caso la correlación lineal calculada es de 0,7.
-
3.5
3
-
3.5 3
Talla (eje X)
Peso (eje Y)
Gráfico 1:
Diagrama de dispersión
de la talla con el peso
Se observa mejor dicha tendencia si se adiciona al diagrama de dispersión una línea
recta de tendencia (gráfico 2), hacia la cual los puntos se agrupan.
-3,5
3
-3,5 3
Talla
Peso
Gráfico 2:
Diagrama de dispersión
de la talla con el peso
Selección de Lecturas de Análisis de Datos en la Cultura Física
53
El diagrama de dispersión entre la talla y el peso puede también dibujarse
intercambiando los ejes, o sea, situando el peso en el eje X y la talla en el eje Y
(gráfico 3). Las posibilidades de análisis son las mismas.
-
3,5
3
-3,5 3
Peso
Talla
Gráfico 3:
Diagrama de dispersión
de la talla con el peso
Algunos tipos de correlación
Se tratarán en este documento algunas tipos de correlaciones entre dos variables
(bivariadas), en el gráfico 2 se presenta la correlación lineal de Pearson, cuyo principio
es calcular con los datos de dos variables en la muestra, la aproximación de los puntos
a una recta, estas variables deben estar en escala métrica (cuantitativa), su fórmula
está en muchos libros de Estadística, por ejemplo en Egaña (2003), Freund (1971) y
Guerra (1987). En el gráfico 4 se observa el diagrama de dispersión de dos variables
con correlación lineal negativa, observe que la recta de tendencia señala la
disminución de una de las variables cuando la otra aumenta.
-3
2,5
-2,5 3
Variable X
Variable Y
Gráfico 4:
Diagrama de dispersión con
una correlacn lineal igual a
-
0,7
Selección de Lecturas de Análisis de Datos en la Cultura Física
54
El gráfico 5 muestra un ejemplo donde la correlación lineal obtenida es cero, aquí la
nube de puntos no se forma hacia ninguna relación lineal.
-3
3
-3 3
Variable X
Variable Y
G
ráfico 5:
Diagrama de dispersión de
una correlación lineal igual a cero
Una correlación de tipo no lineal se observa en el gráfico 6, donde hay una relación
cuadrática entre las variables, por eso la curva de tendencia es una parábola.
Variable X
Variable Y
Gráfico 6:
Correlación cuadrática igual a 0,957
Selección de Lecturas de Análisis de Datos en la Cultura Física
55
Las correlaciones por rangos son otro tipo de la relación bivariada no lineal cuya idea
fundamental es relacionar el ordenamiento de las variables. Se utilizan en las escalas
métrica y ordinal.
Para su cálculo es necesario ranquear los datos de cada variable por separado. El
ranqueo consiste en asignar el valor de 1 al dato de mayor valor numérico, 2 al que le
sigue en valor, y así sucesivamente hasta alcanzar al dato menor que se le asigna en
valor del número de datos que contiene la variable, es como otorgar el lugar en la
competencia, pero con la peculiaridad de que si varios datos son iguales, se
promedian los rangos que debían ocupar estos y se le asigna el mismo valor
(promedio) a todos, continuando con el rango siguiente que no ha sido promediado,
que se le asigna al próximo dato menor a los anteriores en orden.
En la tabla 2 el dato mayor es 9,3 que le sigue el dato 8,4; el valor de 7,5 esta repetido
en cuatro datos que deben ocupar los rangos 3, 4, 5 y 6 cuyo promedio de rangos es
4,5; se continua con el dato 7,2 que ocupa el rango 7 y por último el datos 7,1.
Tabla 2: Ranqueo de 8 datos de una variable
Datos 7,2 7,5 7,5 8,4 9,3 7,5 7,1 7,5
Rango 7 4,5 4,5 2 1 4,5 8 4,5
Existen dos tipos de correlaciones por rangos muy conocidas en la literatura y en los
software estadísticos que son la de Spearman y la de Kendall -ver fórmulas en Egaña
(2003) o en Siegel (1972), aunque puede encontrarse en otros libros de Estadística-.
Cuando el número de datos diferentes en las variables que se procesan no es grande
es recomendable utilizar la correlación por rangos de Kendall. Estas correlaciones
calculadas con datos en escala métrica tienden a ser ligeramente inferiores en
magnitud a la correlación lineal, lo que lleva a algunos investigadores a usar para
variables en escala métrica la correlación por rangos de Spearman pues saben que la
lineal debe ser ligeramente mejor.
En el gráfico 7 puede verse un ejemplo ficticio de un conjunto de datos en las variables
X e Y donde la correlación por rangos de Spearman tiene el valor de 1, que indica un
perfecto acuerdo de las variables en el ordenamiento de los sujetos, sin embargo la
correlación lineal es inferior, observe el desacuerdo de los datos con respecto a la
recta de tendencia.
-2,5
3
-3 2
Variable X
Variable Y
Gráfico 7:
Correlación por rangos de Spearman = 1
Correlación lineal = 0,945
Selección de Lecturas de Análisis de Datos en la Cultura Física
56
Prueba de hipótesis para la correlación
La prueba de hipótesis más interesante sobre la correlación de variables aleatorias es
si la correlación calculada con la muestra indica que hay relación estadística entre las
variables para la población, o sea si la correlación de la población (
i) es diferente de
cero. En términos de hipótesis:
H
0
: i = 0 contra la alternativa H
1
: i > 0.
Para esta hipótesis alternativa se utiliza una prueba de dos colas, si se desea probar
una de las alternativas: que es positiva (H
1
: i > 0) o negativa (H
1
: i < 0), se utiliza la
misma prueba pero para una cola.
Cualquiera de las correlaciones referidas en el punto anterior sirve para probar el par
de hipótesis escogidas, pero cada tipo de correlación calculada tiene una fórmula
diferente para obtener su significación. En Egaña (2003) pueden verse las fórmulas y
procedimientos para las pruebas de hipótesis de estas correlaciones. En particular,
Siegel (1972) ilustra con ejemplos el procedimiento de cálculo de las correlaciones por
rangos que se tratan aquí y de sus respectivas pruebas de hipótesis.
Por otra parte, los software estadístico acostumbran, en el cálculo de las correlaciones
señalar las que tienen significación estadística (casi siempre con un nivel de 0,05 sino
se le indica lo contrario).
El procedimiento general de estas pruebas de hipótesis es rechazar H
0
si el valor
obtenido de la significación es menor que el nivel de significación utilizado y entonces
la relación entre las variables es significativa al nivel utilizado.
Para aplicar la prueba de hipótesis de la correlación lineal de Pearson es necesario
que las variables tengan distribución normal, por eso algunos investigadores prefieren
calcular la correlación por rangos de Spearman en las variables con escala métrica,
pues esta no necesita de tal premisa y tienen en cuenta que el valor de la primera es
con frecuencia, ligeramente superior a la segunda.
Es necesario señalar la importancia del tamaño de la muestra al calcular una
correlación, pues algunos investigadores quieren obtener valores interpretables de las
correlaciones con pocos datos. En la tabla 3 se puede apreciar el tamaño de muestra
mínimo necesario para que una correlación lineal de Pearson (en magnitud) calculada
con la muestra permita rechazar H
0
a un nivel de significación de 0,05. Esto quiere
decir, por ejemplo, que si usted necesita tener en cuenta correlaciones calculadas con
una magnitud superior a 0,4 es necesario que tenga una muestra igual o superior a 25.
Tabla 3: Tamaño de muestra mínimo para una relación significativa al 0,05 (2 colas)
Correlación de Pearson Tamaño de muestra mínimo
±0,9 5
±0,8 7
±0,7 9
±0,6 12
±0,5 16
±0,4 25
±0,3 44
±0,2 97
±0,1 385
Es necesario hacer un breve análisis de los conceptos de dependencia e
independencia estadística de las variables aleatorias; y el concepto de correlación, es
de tal manera que si el valor de la correlación entre las variables es diferente de cero
entonces estas son estadísticamente dependientes, lo que determina su relación, pero
si la correlación entre las variables es cero no se puede asegurar la independencia
Selección de Lecturas de Análisis de Datos en la Cultura Física
57
entre ellas, solo ocurre si las mismas tienen distribución normal. En la términos
prácticos, si la correlación obtenida de una muestra no permite rechazar la hipótesis
H
0
: i = 0 entonces no se puede estar seguro de la independencia de las variables. Es
importante antes de decir que son independientes tener en cuenta las siguientes
causas:
1. El tamaño de muestra sea insuficiente.
2. Las variables no tengan distribución normal.
3. El tipo de correlación utilizado en el cálculo no sea el adecuado para obtener la
relación entre las variables.
Entrada de datos y salidas en los software para obtener la correlación
En la entrada de datos para la mayoría de los software estadísticos se conforma la
base de datos que es una tabla cuyas columnas son las variables que se desean
correlacionar y las filas representan los sujetos con sus evaluaciones en cada una de
las columnas (variables), es imprescindible que los valores de un mismo sujeto se
encuentre en la misma fila para que el software pueda calcular adecuadamente las
correlaciones que se le soliciten. En las tabla 4 y 4a pueden observarse la base de
datos para un grupo de 12 sujetos (indicados por los números del 1 al 12 en la primera
columna) con las evaluaciones en cada una de las cuatro pruebas físicas (columnas):
salto de longitud sin impulso en metros (salto), tiempo en segundos para la carrera de
50 metros (vel), tiempo en segundos para la carrera de 30 metros (rapidez) y tiempo
en horas, minutos y segundos (tabla 4) o solo en segundos (tabla 4a) para la carrera
de 500 metros (res)
2
. La cantidad de sujetos en esta base de datos son pocos y
posiblemente no se obtengan buenos resultados de las correlaciones, solo se ha
querido mostrar un ejemplo de entrada de datos.
Tabla 4: Datos de 4 Pruebas Físicas con la
res en horas, minutos y segundos
Tabla 4a: Datos de 4 Pruebas Físicas
con la res en segundos
Sujeto salto vel rapidez res Sujeto salto vel rapidez res
1 1.92 11.3 5.5 0:03:52 1 1.92 11.3 5.5 232
2 1.90 9.0 5.0 0:04:25 2 1.90 9.0 5.0 265
3 1.85 11.3 5.2 0:05:01 3 1.85 11.3 5.2 301
4 1.92 13.8 5.6 0:06:26 4 1.92 13.8 5.6 386
5 1.89 11.0 5.8 0:07:34 5 1.89 11.0 5.8 454
6 1.85 10.9 5.3 0:08:50 6 1.85 10.9 5.3 530
7 1.88 11.2 6.0 0:09:46 7 1.88 11.2 6.0 586
8 1.85 10.2 5.7 0:10:57 8 1.85 10.2 5.7 657
9 1.90 10.7 5.4 0:11:03 9 1.90 10.7 5.4 663
10 1.92 11.1 6.2 0:12:31 10 1.92 11.1 6.2 751
11 1.88 9.0 6.0 0:13:42 11 1.88 9.0 6.0 822
12 1.90 9.8 5.9 0:05:59 12 1.90 9.8 5.9 359
Para procesar una base de datos y obtener las correlaciones, usted debe solicitar qué
tipo de correlación bivariadas desea (se han estudiado tres tipos fundamentales de
correlaciones en este documento) y además indicar cuáles variables usted desea
procesar, el software calculará las correlaciones de cada pareja de las variables
procesadas. Los resultados suelen ser una tabla (como la 5) de doble entrada donde
tanto en las filas como en las columnas aparecen el nombre de todas las variables que
usted ha solicitado.
2
Algunos software estadísticos permiten introducir los datos en horas, minutos y segundos
como el SPSS, en otros es necesario convertir cada tiempo a segundos. El lector debe preparar
su bases de datos por la tabla 4 ó 4a según las posibilidades del software que esté utilizando.
Selección de Lecturas de Análisis de Datos en la Cultura Física
58
En la tabla 5 aparecen las correlaciones de 100 sujetos en las variables antes
mencionadas, cada celda interior de la tabla corresponde a la correlación entre las
variables que encabezan su fila y su columna, con asteriscos las que son significativas
a
los niveles de 0,05 y 0,01.
Tabla 5: Correlaciones por rangos de Spearman
Salto Velocidad
Rapidez Resistencia
Salto
1,000
-,458** ,095 -,143
Velocidad
-,458** 1,000 ,019 ,200*
Rapidez
,095 ,019 1,000 ,066
Resistencia
-,143 ,200* ,066 1,000
* Significativa al nivel de 0,05 (2-colas).
** Significativa al nivel de 0,01(2-colas).
Se tratará ahora de reducir la tabla con el fin de hacerla más cómoda para su
interpretación, para mostrarla en un documento o en una exposición.
Las celdas que ocupan la diagonal de la tabla tienen todas los valores de 1 que
indican una relación funcional entre las variables, evidentemente estas son las
correlaciones entre cada variable y ella misma, entonces no se obtiene información
importante con estas celdas, por tanto es mejor eliminar sus valores y en su lugar
poner el nombre de la variable, obteniéndose la tabla 6.
Tabla 6: Correlaciones por rangos de Spearman
Salto
-,458** ,095 -,143
-,458**
Velocidad
,019 ,200*
,095 ,019
Rapidez
,066
-,143 ,200* ,066
Resistencia
* Significativa al nivel de 0,05 (2-colas).
** Significativa al nivel de 0,01(2-colas).
En esta nueva tabla (6), cada celda tiene la correlación entre dos variables que son: se
busca en la misma columna de la celda una de las variables y la otra en la misma fila.
Por ejemplo 0,200 aparece en la segunda columna con la última fila, la segunda
columna corresponde a la velocidad y la última fila a la resistencia, entonces 0,200 es
la correlación entre la velocidad y la rapidez.
Observe ahora que el valor de 0,200 se repite en la celda situada en la última columna
y en la segunda fila, si se buscan las variables a que pertenece esta correlación se
obtienen de nuevo la velocidad con la resistencia, entonces todos los valores de las
correlaciones están repetidos, una vez en las celdas que están sobre la diagonal y la
otra en las celdas por debajo de la diagonal. Podemos entonces eliminar uno de los
triángulos de la tabla y obtener la tabla 7.
Tabla 7: Correlaciones por rangos de Spearman
Salto
-,458**
Velocidad
,095 ,019
Rapidez
-,143 ,200* ,066
Resistencia
* Significativa al nivel de 0,05 (2-colas).
** Significativa al nivel de 0,01(2-colas).
Si usted no tiene interés en mostrar las correlaciones que no son significativas pueden
eliminar sus valores de la tabla y obtener la tabla 8, señalando en el título de la tabla
que solo muestra las correlaciones significativas.
Selección de Lecturas de Análisis de Datos en la Cultura Física
59
Tabla 8: Correlaciones significativas por rangos de Spearman
Salto
-,458**
Velocidad
Rapidez
,200*
Resistencia
* Significativa al nivel de 0,05 (2-colas).
** Significativa al nivel de 0,01(2-colas).
Por último, si desea reducir la tabla y facilitar su observación, puede eliminar las filas y
columnas de las variables que no obtuvieron correlaciones significativas con ninguna
de las otras e indicarlo en la leyenda de la tabla
Tabla 9: Correlaciones significativas por rangos de Spearman
Salto
-,458**
Velocidad
,200*
Resistencia
* Significativa al nivel de 0,05 (2-colas).
** Significativa al nivel de 0,01(2-colas).
Variable sin correlaciones significativas: Rapidez.
Cualquiera de las tablas (de la 5 a la 9) pueden servir de modelo para que usted
muestre los resultados de sus trabajos donde se ha utilizado la correlación.
Trabajo independiente para el lector
1. Busque una base de datos de al menos 30 sujetos medidos en varias variables
relacionados con la cultura física.
2. Clasifique las variables según su escala de medición.
3. Calcule las correlaciones por rangos de Spearman o Kendall utilizando un
software estadístico que esté a su alcance, se recomienda el SPSS, con las
variables que están en escala métrica u ordinal.
4. Confeccione una tabla con las correlaciones obtenidas con uno de los modelos
de las tablas 8 o 9 que aquí aparecen.
5. Haga un informe breve pero detallado, analizando las correlaciones
significativas que aparecen en la tabla confeccionada por usted, indicando la
pareja de variables a que pertenece cada correlación y la relación que existe
entre ellas, según su signo y magnitud, puede escoger el criterio de Zatsiorski o
de Brogli (tabla 1).
6. Intente explicar qué posibles factores producen las correlaciones entre estas
variables.
Utilice alrededor de 4 a 6 variables para hacer este trabajo, después puede repetirlo
con más variables.
Selección de Lecturas de Análisis de Datos en la Cultura Física
60
Bibliografía
Brogli, Ya (1977) Statisticheski metodi v Sporta. Pechatna. Sofía: Baza.
Egaña, E. (2003) La Estadística Herramienta Fundamental en la Investigación
Pedagógica. La Habana: Pueblo y Educación.
Estévez M., M. Arroyo y C. González (2004). La Investigación Científica en la
Actividad Física: su Metodología. La Habana: Deportes.
Freund, J. E. (1971) Estadística Elemental Moderna. La Habana: Edición
Revolucionaria.
Guerra, C. W. y otros. (1987) Estadística. La Habana: Pueblo y Educación.
Hernández-Sampier, R. (2003) Metodología de la Investigación. T 2. La Habana: Félix
Varela.
Mesa, M. (2001) Asesoría Estadística en la Investigación Científica Aplicada a la
Educación Física y el Deporte. Material Mimeografiado. Villa Clara.
Siegel, S. (1972) Diseño Experimental No Paramétrico. La Habana: Edición
Revolucionaria.
Zatsiorski, V. M. (1989) Metrología Deportiva. La Habana: Pueblo y Educación.
Selección de Lecturas de Análisis de Datos en la Cultura Física
61
Guía del trabajo de curso de Análisis de Datos
A través del procesamiento de una base de datos usted confeccionará su trabajo que
consta de:
1. Título
2. Objetivo
3. Justificación
4. Definiciones de trabajo
5. Muestra
6. Técnicas estadísticas empleadas
7. Análisis de los resultados
8. Conclusiones
9. Bibliografía
10. Anexos
Base de datos, muestra y objetivo.
Existe una estrecha relación entre estos tres componentes y son la base fundamental
para el trabajo que se desea hacer. La base de datos constituyen la información que
se va a procesar, se establece en una tabla donde cada fila representan un sujeto y
cada columna el tipo de información (variable) que se tiene de los sujetos.
GRUPO
1 Ejemplo 1: GRUPO 2
SUJETO TALLA PESO MUESTRAS SUJETO TALLA PESO
1 173 76,8 INDEPENDIENTES 6 167 64,6
2 170 70,2 7 171 74,6
3 170 72,3 8 168 69,1
4 171 69,8
5 169 70,4
Aquí hay cinco sujetos en el grupo 1 y tres en el grupo 2 con un total de ocho sujetos,
las variables estudiadas son: talla y peso, que son medidas antropométricas. Las base
de datos se ponen en los anexos.
La muestra son los sujetos (en el ejemplo 1, del 1 al 8) que se utilizan para este
estudio y usted debe decir en este punto:
- Período de tiempo (fecha) en que se tomaron los datos.
- Características comunes de los sujetos (sexo, edad, lugar a que pertenecen como
grupo de personas, nivel deportivo, etc.)
- Cantidad de sujetos por grupo y en general.
- Si se estudian dos o más grupos de personas debe decir en qué se diferencias los
grupos.
- Tipo de muestras: independientes (ejemplo 1) o dependientes (ejemplo 2).
Ejemplo 2:
Sujeto
Salto Inicial Velocidad Inicial Salto Final Velocidad Final
MUESTRAS
1 1,85 10,9 1,92 11,1
DEPENDIENTES
2 1,88 11,2 1,88 9,0
3 1,85 10,2 1,90 9,8
4 1,90 10,7 1,89 10,0
En este ejemplo hay un mismo grupo de cuatro sujetos medido dos veces, al inicio del
período y al final del mismo, las variables que se estudian son el salto y la velocidad,
que son de eficiencia física.
El objetivo de su trabajo está íntimamente relacionado con su muestra y las variables
(base de datos) que se tienen. Haga un solo párrafo por objetivo trazado en su trabajo.
Tenga en cuenta al expresar su objetivo:
Selección de Lecturas de Análisis de Datos en la Cultura Física
62
- El período de tiempo (fecha) en que se tomaron los datos.
- Características comunes de los sujetos (sexo, edad, lugar a que pertenecen como
grupo de personas, nivel deportivo, etc.)
-
El tipo de información que usted tiene en las variables, si es de desarrollo motor,
biológico, psicológico, combinaciones de los anteriores, etc.
- Que hay dos tipos de objetivos que se pueden usar en este trabajo (existen más).
Tipo 1. Comparación de grupos (muestras independientes).
Tipo 2. Progreso alcanzado por el grupo durante un período de tiempo (muestras
dependientes).
Asegúrese que su objetivo responde: ¿En qué fecha se hizo el estudio?, ¿Qué está
estudiando en los sujetos?, ¿Qué tipo de objetivo es?, ¿Quiénes son los sujetos que
se estudian?
Definiciones de trabajo. Variables.
En las definiciones de trabajo se describen las variables que usted utiliza en este
trabajo.
Las variables constituyen la información que se tiene de los sujetos (ver ejemplo 1 y
2), las pruebas que usted utilice son variables. Describa en el documento para cada
variable:
- Características de la misma. Explique qué debe hacer el sujeto para hacer la
medición.
- Si es necesario, bibliografía donde se explica la variable.
- Unidad de medida que se utiliza.
- Escala de medición en que se encuentra.
Título
Escriba brevemente a qué se refiere su trabajo. De manera resumida indica los
objetivos del trabajo.
Justificación
Escriba, según su criterio, para qué puede servir el estudio de su trabajo, ¿Qué
beneficios puede aportar?
Bibliografía
Relacione toda la Bibliografía que haya utilizado, incluyendo la estadística y las
páginas de Internet.
Técnicas estadísticas empleadas
Aquí relaciones todos los métodos estadísticos utilizados en su trabajo, primero los
correspondientes al análisis exploratorio después los gráficos y por último por pruebas
de hipótesis utilizadas.
Análisis de resultados
En el mismo se pondrá cada tabla o gráfico y el análisis del mismo. Use el orden en
que se estudiaron en clases, igual que en las técnicas estadísticas empleadas. Tenga
en cuenta:
- Enumerar cada tabla y gráfico consecutivamente y separando la numeración de
tablas y gráficos.
- Encabezar cada tabla o gráfico con lo que es, su número y a que se refiere. Por
ejemplo:
- Hacer el análisis de la tabla o gráfico inmediatamente después de puesto en el
trabajo.
Tabla 1: Medianas por Grupo de las Pruebas de Eficiencia Física
Selección de Lecturas de Análisis de Datos en la Cultura Física
63
- Haga referencia en el texto del análisis a la tabla o gráfico del que se está
escribiendo.
C
onclusiones
Haga un resumen del análisis de resultados de acuerdo a los objetivos trazados. Debe
contestar a las preguntas: ¿Se cumplieron los objetivos de su trabajo? ¿Por qué?
Anexos
Incluya todo lo que usted crea necesario para la mejor compresión del documento,
como base de datos, las salidas de los software, etc.